ARM

Архітектура ARM (первісно Advanced RISC Machine — поліпшена RISC машина, попередник Acorn RISC Machine) — 32-бітна RISC архітектура процесорів, яку розробила компанія ARM Limited. Широко застосовується у розробці портативних пристроїв. Головною причиною цього є використання енергоощадних технологій. Саме тому ця архітектура суттєво переважає у пристроях, головними ідеями яких є енергоощадність та мобільність[1].

Станом на 2004 рік сімейство ARM займало приблизно 75 % всіх 32-бітних RISC процесорів для мобільних і вбудовуваних застосувань,[2] що робить його найчастіш використовуваним серед усіх 32-бітних архітектур. Процесори ARM знайшли своє застосування у таких пристроях, як мобільні телефони і смартфони, планшети, кишенькові персональні комп'ютери, цифрові аудіоплеєри, калькулятори, ігрові консолі та різній комп'ютерній периферії: маршрутизатори, NAS-сервери, апаратні брендмауери[3].

Історія

Процесор з архітектурою ARM, виготовлений Conexant. Такі процесори найчастіше застосовуються у маршрутизаторах.

ARM дизайн був започаткований в 1983 році як проект розвитку в Acorn Computers[en] для створення компактних процесорів RISC-архітектури. Під керівництвом Софі Вілсон та Стівом Фурбером, ключовим завданням яких була розробка низькорівневої обробки переривань вводу/виводу (як MOS Technology 6502) що використовуються в існуючих комп'ютерах ACORN-івського дизайну. Технологія доступу до пам'яті за допомогою архітектури 6502 дозволила розробникам виробляти швидкі машини без використання дорогого обладнання прямого доступу до пам'яті. Група завершила розробку зразків під назвою ARM1 у квітні 1985 року[4], і першу «реальну» робочу систему ARM2 вже в наступному році.

ARM2 архітектура характеризувалася 32-розрядною шиною даних, 26-розрядна (64 Мбайт) адресного простору і шістнадцять 32-розрядних регістрів. Програмний код був змушений перебувати всередині перших 64 Мбайт пам'яті, тому що лічильник команд був обмежений 26-ма бітами (верхні 6 біт 32-розрядних регістрів зарезервовані як статус-мітки). ARM2, можливо, є найпростішими із використовуваних 32-бітних мікропроцесорів у світі, робота якого забезпечена лише 30000-ми транзисторами (порівняйте із на шість років старішою моделлю Motorola 68000, яка містила близько 70000 транзисторів). Така простота походить від відсутності мікропрограми (що становить приблизно від однієї чверті до однієї третини процесору 68000), і не містив кешу. Ця простота призводила до нижчої швидкості виконання, ніж у процесора Intel 80286[5]. Наступник,ARM3, був випущений з кешом 4KB, що ще більше поліпшило швидкодію.

Наприкінці 1980-х років компанія Apple та VLSI Technology[en] почала працювати з Acorn-ом над новими версіями ядра ARM. Робота була настільки результативною, що в 1990 році Acorn перетворила проектну групу в нову компанію під назвою Advanced RISC Machines. З цієї причини, ARM іноді розшифровують, як Advanced RISC Machines (замість Acorn RISC Machines). Advanced RISC Machines стали ARM Ltd коли їхня материнська компанія, ARM Holdings, вийшла на Лондонську фондову біржу і NASDAQ у 1998 році[6].

В результаті співробітництва Apple-ARM у підсумку був створений ARM6, вперше випущений у 1991 році. Apple використала процесор ARM 610, заснований на ядрі ARM6, як основну базу для кишенькових комп'ютерів Apple Newton. У 1994 році Acorn використовує ARM 610 як основний процесор у RISC PC комп'ютерах. DEC ліцензували ARM6 архітектуру (що викликало деяку плутанину, оскільки вони також виготовляли DEC Alpha) для виготовлення StrongARM. На 233 МГц цей процесор витрачав лише 1 Вт енергії (новіші версії витрачали значно менше). Ця робота була потім передана Intel для врегулювання частини позовів, і Intel скористалися цією можливістю, щоб поновити їх застарілі процесори i960 та i860, які відповідали StrongARM-архітектурі. Пізніше Intel розробила своє власне високопродуктивне рішення, відоме як XScale, яке вони потім продали компанії Marvell.

Ядро ARM, попри всі зміни, залишалося такого ж розміру. В ARM2 було 30000 транзисторів, в той час як ARM6 зріс лише до 35000. ARM бізнес завжди готовий продати ліцензію топології інтегральних схем яку використовують для створення мікроконтролерів і процесорів на основі цього ядра. Найуспішнішої реалізації набув процесор ARM7TDMI, який присутній у майже кожному побутовому приладі, тому що став основою для сотень мільйонів мікроконтролерів. Ідея полягає в тому, що ODM поєднує ARM ядро і деяку кількість необхідних додаткових частин для виробництва повного процесора, який потім можна виготовляти на старих фабриках з виробництва напівпровідникової продукції, і ще бути достатньо ефективними при низьких витратах виробництва. Станом на січень 2008 року виготовлено понад 10 мільярдів ARM ядер, і iSuppli прогнозує виробництво 5 мільярдів на рік до 2011 року.[7]

Загальна архітектура підтримувана смартфонами, КПК та іншими портативними пристроями побудована на ARMv4. Наразі[коли?] більша кількість високотехнологічних пристроїв використовують процесори XScale та ARM926 ARMv5TE, ніж StrongARM, ARM925T і ARM7TDMI основаних на ARMv4 процесорах.

Ядра ARM

Особливості дизайну

Цікавим додатком до дизайну ARM ядра є використання 4-бітного коду обставини на початку кожної інструкції, а це означає що виконання кожної інструкції умовно необов'язкове. Інші процесорні архітектури, як правило, мають код обставини як відгалуження інструкції.

Це значно скорочує кодування біту придатного для переміщення інструкції в доступну пам'ять; але з іншого боку, вона дозволяє уникнути розгалуження інструкцій при генерації коду для малих операторів якщо. Стандартним прикладом є Алгоритм Евкліда: мовою програмування C виглядає так:

    while (i != j)
    { 
       if (i > j) 
           i -= j;
       else 
           j -= i;
    }

Для ARM процесорів асемблерний код виглядає так:

 loop    CMP    Ri, Rj      ; set condition "NE" if (i != j)
                            ;               "GT" if (i > j), 
                            ;            or "LT" if (i < j)           
        SUBGT  Ri, Ri, Rj   ; if "GT", i = i-j;  
        SUBLT  Rj, Rj, Ri   ; if "LT", j = j-i; 
        BNE    loop         ; if "NE", then loop

що дозволяє уникнути розгалуження коду навколо операторів then та else.

Ще однією унікальною особливістю набору є можливість згортання зсувів і обертань при «обробці даних» (арифметичних, логічних, та регіст-регістрових переміщень) інструкції, для прикладу як у C-операторі

a += (j << 2);

окремий цикл інструкції для ARM, може бути оформлено як одне слово.

ADD Ra, Ra, Rj, LSL #2

Це призводить до того, що типові ARM програми щільніші ніж очікувалося і з меншою кількістю звернень до пам'яті, тому конвеєр використовується ефективніше. Навіть попри те, що ARM працює, як багато хто вважає, із нижчою швидкістю, але він в цілому успішно конкурує з набагато складнішими процесорними архітектурами.

ARM процесори також мають деякі особливості, які рідко зустрічаються в інших RISC архітектурах, такі як служби аналогічні до командного лічильника-споріднених рішень (по суті в ARM архітектурі Лічильник команд є одним із 16-ти регістрів) та перед-/пост- прирістні режими адресації.

Thumb

У Thumb-режимі менші операційні коди мають менше функціональних можливостей. Наприклад, тільки розгалуження можуть бути умовними і багато операційних кодів обмежують в доступі лише до половини всіх регістрів процесора. Коротші операційні коди дозволяють поліпшити щільність коду в цілому, хоча деякі операції вимагають додаткових інструкцій. У ситуаціях коли порти пам'яті або ширина шини менші менш ніж 32 біти, коротший Thumb-операційний код дозволяє збільшити показники у порівнянні з 32-х розрядним ARM кодом, менше програмного потрібно завантажувати в процесор із обмеженою пропускною здатністю пам'яті.

Вбудовані пристрої, такі як ігрова консоль Game Boy Advance, як правило мають невеликий обсяг доступної оперативної пам'яті з повною 32-бітної шиною даних; більшість звернень проходять через 16-бітну або вужчу вторинну шину. Зазвичай у цій ситуації є сенс скомпілювати Thumb-код і вручну оптимізувати кілька найінтенсивніше використовуваних розділів процесора застосовуючи повну інструкцію 32-бітних ARM-ядер, розміщуючи ці ширші інструкції в доступній пам'яті із 32-бітною шиною.

Перший процесор з інструкцією Thumb-декодування був ARM7TDMI. Всі ARM9 та новіші серії, в тому числі XScale, включають інструкції Thumb-декодеру.

Розширення інструкцій обробки цифрових сигналів

Для того, щоб поліпшити архітектуру ARM для цифрової обробки сигналів і мультимедійних застосунків, до набору включили деякі нові інструкції[8]. Це виглядало як приставка «Е» в назвах ARMv5TE і ARMv5TEJ архітектур.

У нових інструкціях є подібності до архітектури цифрового сигнального процесору.

Thumb-2

Thumb-2 технологія зробила свій дебют у ядрі ARM1156, проголошеному в 2003 році. Thumb-2 розширює обмежений набір 16-бітних команд Thumb набором додаткових 32-бітних команд. Таким чином, Thumb-2 є набором команд змінної ширини. В результаті для Thumb-2 досягнута щільність коду, аналогічна Thumb-у та швидкість виконання, аналогічна 32-бітним командам ARM.

Thumb-2 розширює набори команд як ARM, так і Thumb для більшої функціональності, в тому числі такими командами, як: маніпуляція бітовим полем, таблиця розгалужень, та умовне виконання.

Всі ARMv7 чипи підтримують Thumb-2 набір інструкцій. Мікроконтролери архітектур ARMv6-M (Cortex-M0, -M0+, -M1), ARMv7-M (Cortex-M3, -M4, -M7) та ARMv8-M (Cortex-M23, -M33, …) підтримують тільки Thumb-2. Інші чипи архітектур ARMv6, ARMv7, ARMv8 (у 32-бітному режимі), тобто серії ARM11, Cortex-R і Cortex-A, підтримують як «набір команд ARM режиму» і «набір команд Thumb-2 режиму».[9][10][11]

Середовище виконання Thumb (ThumbEE)

Вдосконалений SIMD (NEON)

Вдосконалений SIMD (Single-Instruction Multiple-Data — один потік команд і багато потоків даних) розширення технології, позначене як NEON, є поєднанням наборів з 64- та 128-бітових SIMD інструкцій, що надає стандартизоване прискорення для засобів медіа та сигнальної обробки прикладних програм. NEON може виконати MP3-декодування на процесорах, що працюють на 10 МГц, а також здатний розгалужувати оператори на малі секції часто вживаного простого коду. Такий інструмент використовується у особливих високорівневих мовах програмування, які можуть запускати GSM AMR (Adaptive Multi-Rate — адаптивну багаторангову) мову кодеків на більш ніж 13 МГц. Він має комплексний[що?] набір команд, окремий регістр файлів і незалежне обладнання для виконання. NEON підтримують 8 -, 16 -, 32 — і 64-bit ціле і окрему точності[що?] з рухомою комою даних і працює в SIMD операції з обробки аудіо/відео, а також графічних та ігрових обробках. У NEON, SIMD підтримує до 16 операцій одночасно.

VFP

Технологія VFP — це співпроцесорне розширення для архітектури ARM. Він надає недорогі одинарну- та подвійну точності в обчисленнях із рухомою комою, повністю сумісну з ANSI/IEEE 754 (стандарт для арифметичних дій з бінарною рухомою комою). VFP забезпечує такі обчислення, що є придатним для широкого спектра застосунків, які використовуються в КПК, смартфонах, при голосовий компресії і декомпресії, тривимірній графіці та цифровому звуку, принтерах, комп'ютерних приставках, а також автомобільних застосунках. VFP Архітектура також підтримує виконання коротких векторних інструкцій забезпечуючи SIMD-паралелізм. Це корисно в графіці і в застосунках обробки сигналів шляхом зменшення розміру коду та збільшення пропускної здатності.

Інші SIMD та/або співпроцесори з плавучою точкою в ARM-основаних процесорах включають FPA, FPE, iwMMXt. Вони забезпечують приблизно ту ж функціональність, що і VFP, але кодово-несумісні з ним.

Можливості безпеки (TrustZone)

Розширення безпеки під комерційною назвою TrustZone™ (TZ — зона довіри) з'явилися в ARMv6KZ та пізніших архітектурних профілях. Воно забезпечує недорогу альтернативу додаванню ще одного спеціалізованого ядра безпеки до SoC шляхом надання двох віртуальних процесорів з підтримкою апаратних засобів контролю доступу. Це дає можливість ядру застосунків перемикатися між двома станами, позначеними як світи англ. worlds (для зменшення плутанини з іншими назвами доменів можливостей), таким чином, щоб запобігти витоку інформації із надійніших сфер до менш надійних. Це об'єктне перемикання в цілому ортогональне всім іншим можливостям процесора і так кожен об'єкт може функціонувати незалежно від інших, використовуючи одне й те ж ядро. Пам'ять і периферія потім ставляться до відома про чинні об'єкти ядра і може використовувати це для забезпечення контролю доступу до секретам та коду для пристроїв. Типовим застосуванням TrustZone технології це запуск операційної системи з широкими можливостями у в менш довірливих об'єктах і менше безпечно-спеціалізований код в надійніших об'єктах.

На практиці, з тих пір як особливості деталей виконання TrustZone є власністю і не були публічно розкриті в огляді, не ясно який рівень гарантій передбачається наданою моделлю небезпеки.

Jazelle

Докладніше: Jazelle

Технологія, названа Jazelle DBX (англ. Direct Bytecode eXecution — Безпосереднє виконання байткоду) дозволяє оновленій ARM-архітектурі виконувати деякі коди Java в апаратній частині, як третій робочий стан поруч з дійсними ARM- і Thumb- режимах[12].

Ліцензія ARM

ARM Ltd, не виготовляє і не продає мікропроцесори на основі їхнього власного дизайну, але продає ліцензії процесорної архітектури. ARM пропонує широкий вибір ліцензійних умов, різної вартості та комплектації. Для всіх ліцензіатів, ARM забезпечує опис апаратної інтеграції основних ARM ядер, а також повний набір інструментів розробки програмного забезпечення (компіляторів, налагоджувачів, SDK, див. також ARM Compiler), а також надає право продавати виготовлені вироби, що містять ARM CPU[джерело?].

Ліцензовані фабрики напівпровідникової продукції, які хотіли б інтегрувати ядра ARM для виготовлення своїх власні чипів, зазвичай, тільки зацікавлені у придбанні готових до виробництва перевірених та готових до вживання схем. Для цих клієнтів, ARM постачає логічну схему опису таблиці з'єднань вибраного ARM ядра, разом із зібраною імітаційною моделлю та тестується програмами для сприяння інтеграції дизайну та контролю[джерело?].

Для фабрик інтегральних пристроїв (IDM — integrated device manufacturers) компанія пропонує процесорні топографічні схеми у формі RTL (Register transfer level — Рівень регістрових передач) (Verilog), готової для синтезу. Разом із придбанням готової до виробництва RTL, клієнт має можливість здійснювати оптимізацію та розширення архітектурного рівня. Це дозволяє розробнику досягати нестандартного дизайну, потребуючи інші показники за незмінного списку схем (вища тактова частота, наднизька споживана потужність, інструкції набору розширень і т. д.). Хоча ARM не надає ліцензіатам права перепродати саму архітектуру ARM, отримувачі ліцензії можуть вільно продавати виготовлені вироби (процесори та плати з ними, готові систем і т. д.). Комерційні заводи з виготовлення напівпровідників можуть бути особливим випадком, їм дозволено не тільки продавати кінцеві напівпровідникові матеріали, які містять ARM ядра, вони зазвичай ще мають право виготовляти ARM ядра для інших клієнтів[джерело?].

Із архітектурної точки зору, менш функціональні ядра ARM коштують менше, ніж вартість ліцензій для ядер із вищою функціональністю. У перерахунку реалізації в кремній, можливість адаптації в основному дорожче, ніж стандартне макроядро. Отримуючи ядра ARM та використовуючи внутрішню службу розробок, клієнт може знизити або компенсувати виплати за попередній ліцензійний збір ARM. У порівнянні з спеціалізованими напівпровідниковими ливарнями (наприклад як TSMC та UMC), без власної служби розробок, Fujitsu/Samsung сплачують у 2-3 рази більше за виготовлену кремнієву пластину. Для низьких і середніх за обсягом заявок, проектні служби кремнієвих майстерень пропонують нижчі загальні розцінки (через субсидування ліцензійного збору). В довгостроковій перспективі, для великого за обсягом масового виробництва продукції відбувається зниження витрат на ліцензії ARM, таким чином виправдовуючи вибір спеціалізованої майстерні[джерело?].

Багато фірм-розробників інтегральних схем та напівпровідників утримують ARM ліцензії; Analog Devices, Atmel, Broadcom, Cirrus Logic, Faraday technology, Freescale, Fujitsu, Intel (через свою підрядну Digital Equipment Corporation), IBM, Infineon Technologies, LG, Marvell Technology Group, NEC, Nintendo, NVIDIA, NXP Semiconductors, OKI, Qualcomm, Samsung, Sharp, STMicroelectronics, Symbios Logic, Texas Instruments та VLSI,Yamaha та ZiiLABS — ось невелика кількість з багатьох компаній, які мають ліцензію на ARM в тій чи іншій формі. Хоча ARM ліцензії поширюються на умові нерозголошення інформації, але в галузі інтегральних мікросхем ARM широко відома як одна із найдорожчих ядерних процесорів. Один замовник продукту, який хоче використати базове ядро ARM оплачує одноразову ліцензію на суму понад $ 200000 USD. У випадках, коли передбачаються значні кількісні і архітектурні зміни, плата за ліцензію може перевищувати $ 10 млн USD[джерело?].

Приблизні ліцензійні витрати

ARM в 2006 році опублікувало річну фінансову звітність, в якій вказано відрахування на загальну суму 88,7 млн фунтів стерлінгів (164,1 млн доларів США), що були результатом ліцензування поставок на 2.45 мільярдів схем[13]. Це еквівалентно 0,036 фунтів стерлінгів (0,067 USD) в розрахунку на представлену схему (пристрій). Однак, це середня ціна на всі ядра, в тому числі дорогі, нові та недорогі старі.

Прибуток ARM в тому ж році з ліцензійних надходжень за ядра процесорів сягнув £ 65,2 млн. ($ 119,5 млн). Це в середньому 1 млн фунтів стерлінгів (1,84 млн доларів США) з одного ліцензіата. Знову ж таки, це середня ціна, враховуючи нові та старі ядра.

З огляду на те, що прибуток ARM в 2006 році від процесорних ядер становив приблизно 60 % від ліцензійних платежів і 40 % від продажу ліцензій, ARM отримує еквівалент 0,06 фунтів стерлінгів (0,11 доларів США) за одну відвантажену схему, враховуючи як відрахування так і ліцензії. Проте, часто при завершені строку дії однієї ліцензії купується нова для нової технології, тобто питома частка продажу ліцензій (а також відрахування) переважають над створенням продуктів. Отже, представлені вище цифри не зображають реальної вартості будь-якого окремого продукту ARM[джерело?].

Примітки

  1. Архівована копія. Архів оригіналу за 19 листопада 2008. Процитовано 4 листопада 2008.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) [Архівовано 2008-11-19 у Wayback Machine.]
  2. ARM product backgrounder (PDF). Архів оригіналу (PDF) за 14 жовтня 2004. Процитовано 14 жовтня 2004.
  3. В 4-му кварталі 2009-го року було відвантажено більш ніж 1,3 мільярди ARM процесорів. Архів оригіналу за 4 вересня 2012. Процитовано 8 лютого 2010.
  4. Sophie Wilson, Roger Wilson (2 листопада 2 1988). Some facts about the Acorn RISC Machine (англ.). Група новинcomp.arch. Архів оригіналу за 10 лютого 2010. Процитовано 25 травня 2007.
  5. Patterson, Jason. The History Of Computers During My Lifetime — The 1980's (англ.). Архів оригіналу за 23 березня 2008. Процитовано 4 листопада 2008. {{cite web}}: Проігноровано |chapter= (довідка)
  6. «Прес-конференція корпорації ARM», ARM технології
  7. «ARM досягнуло 10 мільярдів процесорних кристалів» [Архівовано 7 грудня 2008 у Wayback Machine.], ARM Технології, 22 січня 2008
  8. Архівована копія. Архів оригіналу за 14 квітня 2009. Процитовано 4 листопада 2008.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
  9. Why use Arm architecture? (англ.). Архів оригіналу за 15 квітня 2009. Процитовано 4 листопада 2008.
  10. ARM aims son of Thumb at uCs, ASSPs, SoCs. 19 жовтня 2004. Архів оригіналу за 9 грудня 2012. Процитовано 4 листопада 2008.
  11. ARM1156T2F-S architecture with Thumb-2 core technology (англ.). Архів оригіналу за 17 січня 2020. Процитовано 18 квітня 2022.
  12. Jazelle DBX. Архів оригіналу за 27 травня 2005. Процитовано 4 листопада 2008.
  13. «Бізнес-огляд/Фінансовий огляд/МСФЗ», стор 10, ARM річний звіт та інша фінансова звітність, 2006 [Архівовано 22 грудня 2011 у Wayback Machine.]. Отримано 7 травня 2007

Див. також

  • Linaro — некомерційна організація, що займається консолідацією та оптимізацією програмного забезпечення з відкритими сирцевими кодами для платформ ARM
  • MIPS, IA32 та X86-64

Посилання