İlk olarak Armv8-A mimarisi ile tanıtıldı. Arm her yıl yeni bir uzantı yayınlar.[1]
Armv8.x ve Armv9.x uzantıları ve özellikleri
Ekim 2011'de duyurulan Armv8-A, ARM mimarisinde temel bir değişikliği temsil etmektedir. "AArch64" adlı isteğe bağlı bir 64 bit mimari ve ilişkili yeni "A64" komut kümesi ekler. AArch64, mevcut 32 bit mimari ("AArch32" / Armv7-A) ve komut seti ("A32") ile kullanıcı alanı uyumluluğu sağlar. 16-32bit Thumb komut seti "T32" olarak anılır ve 64-bit karşılığı yoktur. Armv8-A, 32 bit uygulamaların 64 bit işletim sisteminde yürütülmesine ve 32 bit işletim sisteminin 64 bit hipervizörün kontrolü altında olmasına izin verir.[2] ARM, Cortex-A53 ve Cortex-A57 çekirdeklerini 30 Ekim 2012'de duyurdu. Apple, bir tüketici ürününde (iPhone 5S) Armv8-A uyumlu bir çekirdek (Cyclone) yayınlayan ilk şirket oldu. AppliedMicro, bir FPGA kullanarak, Armv8-A'nın demosunu yapan ilk kurumdur. Samsung'un ilk Armv8-A SoC'si, Galaxy Note 4'te kullanılan ve büyük bir dört Cortex-A57 ve Cortex-A53 çekirdekli iki kümeye sahip Exynos 5433'tür. big.LITTLE konfigürasyon; ancak yalnızca AArch32 modunda çalışacaktır.[3]
Hem AArch32 hem de AArch64 için Armv8-A, VFPv3/v4 ve gelişmiş SIMD (Neon) standardı yapar. Ayrıca AES, SHA-1 / SHA-256 ve sonlu alan aritmetiğini destekleyen kriptografi talimatları da ekler.[4]
AES şifreleme/şifre çözme ve SHA-1/SHA-2 karma yönergeleri de bu kayıtları kullanır.
Yeni bir istisna sistemi
Daha az bankalı kayıt ve mod.
64 bit'e kolayca genişletilmek üzere tasarlanmış mevcut Büyük Fiziksel Adres Uzantısını (LPAE) temel alan 48 bit sanal adreslerden bellek çevirisi.
Uzantı: Veri toplama ipucu (Armv8.0-DGH)
AArch64, Armv8-A'da tanıtıldı ve Armv8-A'nın sonraki sürümlerine dahil edildi. Ayrıca Armv8-A'daki tanıtımından sonra Armv8-R'de bir seçenek olarak tanıtıldı; Armv8-M'ye dahil değildir.
Talimat biçimleri
Bir A64 komutunun hangi gruba ait olduğunu seçmek için ana işlem kodu 25-28 bitlerindedir.
A64 talimat formatları
Tip
Bit
31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Rezerve
op0
0000
op1
Anında sabit 16 bit
ayrılmamış
0001
SVE Talimatları
0010
ayrılmamış
0011
Veri İşleme — Anında PC-rel.
operasyon
immlo
10000
immhi
Yol
Veri İşleme — Anında Diğerleri
sf
100
01-11
Yol
Şubeler + Sistem Talimatları
op0
101
op1
op2
Yükleme ve Depolama Talimatları
op0
1
op1
0
op2
op3
op4
Veri İşleme — Kayıt Ol
sf
op0
op1
101
op2
op3
Veri İşleme — Kayan Nokta ve SIMD
op0
111
op1
op2
op3
Armv8.1-A
Aralık 2014'te Armv8.1-A,[6] "v8.0'a göre artan faydalar" içeren bir güncelleme duyuruldu. Geliştirmeler iki kategoriye ayrıldı: talimat setindeki değişiklikler ve istisna modeli ve bellek çevirisindeki değişiklikler.
Bazı kitaplık optimizasyonları için fırsatları etkinleştirmek için hem AArch32 hem de AArch64 için Gelişmiş SIMD komut setine eklemeler:
İmzalı Doyurucu Yuvarlama Katlama Çarpma Birikim, Yüksek Yarıyı Döndürme.
İmzalı Doyurucu Yuvarlama Katlama Çarpma Çıkarma, Yüksek Yarıyı Döndürme.
Talimatlar vektör ve skaler formlarda eklenir.
Yapılandırılabilir adres bölgeleriyle sınırlı bellek erişim sırası sağlayabilen bir dizi AArch64 yükleme ve saklama talimatı.
v8.0'daki isteğe bağlı CRC talimatları, Armv8.1'de bir gereklilik haline gelir.
İstisna modeli ve bellek çeviri sistemi için geliştirmeler şunları içeriyordu:
Yeni Ayrıcalıklı Erişim Asla (PAN) durum biti, açıkça etkinleştirilmedikçe kullanıcı verilerine ayrıcalıklı erişimi engelleyen kontrol sağlar.
Sanallaştırma için artırılmış VMID aralığı; daha fazla sayıda sanal makineyi destekler.
Sayfa tablosu erişim bayrağının donanım güncellemesi için isteğe bağlı destek ve isteğe bağlı, donanım güncelleştirilmiş, kirli bit mekanizmasının standartlaştırılması.
Sanallaştırma Ana Bilgisayar Uzantıları (VHE). Bu geliştirmeler, Host ve Guest işletim sistemleri arasında geçiş yaparken ortaya çıkan yazılım yükünü azaltarak Tip 2 hipervizörlerin performansını iyileştirir. Uzantılar, Ana İşletim Sisteminin önemli bir değişiklik olmaksızın EL1'in aksine EL2'de çalışmasına izin verir.
İşletim sisteminin donanım desteğine ihtiyaç duymadığı durumlarda, işletim sistemi kullanımı için bazı çeviri tablosu bitlerini serbest bırakan bir mekanizma.
Ocak 2016'da Armv8.2-A duyuruldu.[8] Geliştirmeleri dört kategoriye ayrıldı:
İsteğe bağlı yarı kesinlikli kayan noktalı veri işleme (yarı kesinlik zaten destekleniyordu, ancak işleme için desteklenmiyor, tıpkı bir depolama biçimi olarak.)
Bellek modeli geliştirmeleri
Güvenilirlik, Kullanılabilirlik ve Hizmet Verilebilirlik Uzantısının (RAS Uzantısı) Tanıtımı
İstatistiksel profil oluşturmaya giriş
Ölçeklenebilir Vektör Uzantısı (SVE)
Ölçeklenebilir Vektör Uzantısı (SVE), yüksek performanslı bilgi işlem bilimsel iş yüklerinin vektörleştirilmesi için özel olarak geliştirilmiş "ARMv8.2-A mimarisinin isteğe bağlı bir uzantısıdır ve daha yenidir".[9][10] Spesifikasyon, 128 ila 2048 bit arasında değişen vektör uzunluklarının uygulanmasına izin verir. Uzantı, NEON uzantılarının tamamlayıcısıdır ve yerini almaz.
Fujitsu A64FX ARM işlemci kullanılarak Fugaku süper bilgisayarında 512 bitlik bir SVE varyantı zaten uygulandı. "2021 civarında tam operasyonlara başlama hedefi" ile dünyanın en yüksek performanslı süper bilgisayarı olmayı hedefliyor.[11]
SVE, otomatik vektörleştirmeyi destekleyen GCC 8 [10] ve C intrinsiklerini destekleyen GCC 10 ile GCC derleyicisi tarafından desteklenir. Temmuz 2020 itibarıyla, LLVM ve clang, C ve IR özlerini destekler. ARM'nin kendi LLVM çatalı otomatik vektörleştirmeyi destekler.[12]
Armv8.3-A
Ekim 2016'da Armv8.3-A duyuruldu. Geliştirmeleri altı kategoriye ayrıldı:[13]
İşaretçi kimlik doğrulaması [14] (yalnızca AArch64); mimariye zorunlu uzantı (yeni bir blok şifresine dayalı, QARMA [15] ) (derleyicilerin güvenlik özelliğinden yararlanmaları gerekir, ancak talimatlar NOP alanında olduğundan, eski yongalarda ekstra güvenlik sağlamasa da geriye dönük olarak uyumludurlar).
İç içe sanallaştırma (yalnızca AArch64)
Gelişmiş SIMD karmaşık sayı desteği (AArch64 ve AArch32); örneğin 90 derecenin katları ile döndürmeler.
Yeni FJCVTZS (Kayan Noktalı JavaScript'i İmzalı Sabit Noktaya Dönüştürme, Sıfıra doğru yuvarlama) talimatı.[16]
Bellek tutarlılık modelinde bir değişiklik (yalnızca AArch64); C++11 / C11'in (varsayılan olmayan) daha zayıf RCpc (Sürüm Tutarlı işlemci tutarlı) modelini desteklemek için (varsayılan C++11/ C11 tutarlılık modeli önceki Armv8'de zaten destekleniyordu).
Sistem tarafından görülebilen daha büyük önbellekler için kimlik mekanizması desteği (AArch64 ve AArch32)
Armv8.3-A mimarisi artık (en azından) GCC 7 derleyicisi tarafından desteklenmektedir.[17]
Armv8.4-A
Kasım 2017'de Armv8.4-A duyuruldu. Geliştirmeleri şu kategorilere giriyor:[18][19][20]
"SHA3 / SHA512 / SM3 / SM4 kripto uzantıları"
Geliştirilmiş sanallaştırma desteği
Bellek Bölümleme ve İzleme (MPAM) yetenekleri
Yeni bir Güvenli EL2 durumu ve Etkinlik İzleyicileri
İşaretli ve işaretsiz tam sayı nokta çarpımı (SDOT ve UDOT) talimatları.
Mart 2021'de ARMv9-A duyuruldu. ARMv9-A'nın temeli, Armv8.5'in tüm özellikleridir.[26][27][28] ARMv9-A ayrıca şunları da ekler:
Ölçeklenebilir Vektör Uzantısı 2 (SVE2). SVE2, talimat başına daha fazla iş yapılmasına izin vermek için artırılmış ince taneli Veri Düzeyi Paralelliği (DLP) için SVE'nin ölçeklenebilir vektörleştirmesini temel alır. SVE2, bu faydaları DSP ve şu anda Neon kullanan multimedya SIMD kodu da dahil olmak üzere daha geniş bir yazılım yelpazesine getirmeyi amaçlamaktadır.[29] LLVM / Clang 9.0 ve GCC 10.0 geliştirme kodları, SVE2'yi destekleyecek şekilde güncellendi.[29][30]
İşlemsel Bellek Uzantısı (TME). x86 uzantılarının ardından TME, Donanım İşlemsel Belleği (HTM) ve İşlem Kilidi Elision (TLE) için destek getiriyor. TME, iş parçacığı başına daha fazla iş yapılmasına izin vermek için kaba taneli Diş Düzeyi Paralelliğini (TLP) artırmak için ölçeklenebilir eşzamanlılık getirmeyi amaçlar.[29] LLVM / Clang 9.0 ve GCC 10.0 geliştirme kodları, TME'yi destekleyecek şekilde güncellendi.[30]
SIMD matris işleme talimatları, BFDOT, BFMMLA, BFMLAL ve BFCVT
sanallaştırma, sistem yönetimi ve güvenlik için geliştirmeler
ve aşağıdaki uzantılar (bu LLVM 11,[35] için zaten destek eklemiştir):
Gelişmiş Sayaç Sanallaştırması (Armv8.6-ECV)
İnce Taneli Tuzaklar (Armv8.6-FGT)
Activity Monitor sanallaştırması (Armv8.6-AMU)
Örneğin, ayrıntılı tuzaklar, Olayı Bekle (WFE) yönergeleri, EnhancedPAC2 ve FPAC. SVE ve Neon için Bfloat16 uzantıları, temel olarak derin öğrenme kullanımı içindir.[36]
memcpy() ve memset() stili işlemleri optimize etme talimatları (AArch64)
PAC'deki Geliştirmeler (AArch64)
İpuçlu koşullu dallar (AArch64)
Armv8-R (gerçek zamanlı mimari)
Armv8-R profiline isteğe bağlı AArch64 desteği eklendi ve onu uygulayan ilk Arm çekirdeği Cortex-R82 oldu.[37] Bellek bariyeri talimatlarında bazı değişikliklerle birlikte A64 komut setini ekler.[38]
Kaynakça
^"Overview". Learn the architecture: Understanding the Armv8.x and Armv9.x extensions. 20 Eylül 2022 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Eylül 2022.
^"GCC 7 Release Series – Changes, New Features, and Fixes". 2 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Eylül 2022. ARMv8.3-A mimarisi artık desteklenmektedir. -march=armv8.3-a seçeneği belirtilerek kullanılabilir. [..] -msign-return-address= seçeneği, ARMv8.3-A Pointer Authentication Extensions kullanarak dönüş adresi korumasını etkinleştirmek için desteklenir.
^Schor, David (30 Mart 2021). "Arm Launches ARMv9". WikiChip Fuse (İngilizce). 27 Temmuz 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 27 Temmuz 2021.