Систолический массив

Сортирующий восьмивходовый систолический массив

В параллельных компьютерных архитектурах систолический массив представляет собой однородную сеть тесно связанных блоков обработки данных (DPU), называемых ячейками или узлами . Каждый узел независимо и параллельно вычисляет частичный результат как функцию данных, полученных от его вышестоящих соседей, сохраняет результат внутри себя и передает его нижестоящим узлам. Систолические массивы были впервые использованы в Colossus Mark II[1] в 1944 году, одном из первых компьютеров, использовавшихся для взлома немецких шифров Лоренца. Из-за секретности компьютеров Colossus систолические массивы были независимо заново открыты Х. Т. Кунгом и Чарльзом Лейзерсоном, которые описали массивы для множества вычислений плотной линейной алгебры (произведение матриц, решение систем линейных уравнений, LU-разложение и т. д.) для ленточных матриц. Ранние применения включают вычисление наибольших общих делителей целых чисел и многочленов. Иногда их классифицируют как архитектуры с несколькими инструкциями и одними данными (MISD) согласно таксономии Флинна, но эта классификация вызывает сомнения, поскольку можно предложить убедительные аргументы для выделения систолических массивов в отдельную группу, отличную от любой из четырех категорий Флинна: SISD, SIMD, MISD, MIMD, как это обсуждается позже в этой статье.

Параллельные входные данные проходят через сеть аппаратных процессорных узлов, которые комбинируют, обрабатывают, объединяют или сортируют входные данные в производный результат. Поскольку волнообразное распространение данных через систолический массив напоминает пульс сердечно-сосудистой системы человека, название систолическое было позаимствовано из медицинской терминологии. Название происходит от систолы по аналогии с регулярным перекачиванием крови сердцем.

Применения

Систолические массивы часто строго привязаны к конкретным операциям, таким как «умножение и накопление», для выполнения массовой параллельной интеграции, свертки, корреляции, умножения матриц или задач сортировки данных. Они также используются для алгоритмов динамического программирования, применяемых в анализе последовательностей ДНК и белков.

Архитектура

Систолический массив обычно состоит из большой монолитной сети примитивных вычислительных узлов, которые могут быть аппаратно или программно настроены для конкретного применения. Узлы обычно фиксированные и идентичные, а межсоединение программируемое. Более общие процессоры волнового фронта, напротив, используют сложные и индивидуально программируемые узлы, которые могут быть или не быть монолитными, в зависимости от размера массива и параметров конструкции. Другое отличие состоит в том, что систолические массивы основаны на синхронной передаче данных, в то время как волновой фронт обычно работает асинхронно .

В отличие от более распространенной архитектуры фон Неймана, где выполнение программы следует сценарию инструкций, хранящихся в общей памяти, адресация и последовательность которых осуществляется под управлением счетчика программ ЦП (ПК), отдельные узлы в систолическом массиве запускаются по прибытии новых данных и всегда обрабатывают данные одинаковым образом. Фактическая обработка в каждом узле может быть жестко запрограммирована или блочно микрокодирована, и в этом случае общая индивидуальность узла может программироваться блочно. Парадигма систолического массива с потоками данных, управляемыми счетчиками данных, является аналогом архитектуры фон Неймана с потоком команд, управляемым программным счетчиком. Поскольку систолический массив обычно отправляет и получает несколько потоков данных, а для создания этих потоков данных требуется несколько счетчиков данных, он поддерживает параллелизм данных .

Цели и преимущества

Основным преимуществом систолических массивов является то, что все данные операндов и частичные результаты хранятся внутри массива процессора (проходят через него). Нет необходимости обращаться к внешним шинам, основной памяти или внутренним кэшам во время каждой операции, как в случае с последовательными машинами фон Неймановой или Гарвардской архитектуры . Последовательностные ограничения на параллельную производительность, продиктованные законом Амдала, также не применимы, поскольку зависимости данных неявно обрабатываются программируемым межузловым соединением, и нет последовательных шагов в управлении высокопараллельным потоком данных.

Таким образом, систолические массивы хорошо себя проявляют для искусственного интеллекта, обработки изображений, распознавания образов, компьютерного зрения и других задач, с которыми мозг животных справляется особенно хорошо. Процессоры Wavefront в целом также могут быть очень хороши в машинном обучении, реализуя самонастраивающиеся нейронные сети в аппаратном обеспечении.

Споры о классификации

Хотя систолические массивы официально классифицируются как MISD, их классификация несколько проблематична. Поскольку вход обычно представляет собой вектор независимых значений, систолический массив определенно не является SISD . Поскольку эти входные значения объединяются между собой и комбинируются в результат (результаты) и не сохраняют свою независимость, как в блоке векторной обработки SIMD, массив не может быть классифицирован как таковой. Следовательно, массив также не может быть классифицирован как MIMD, потому что MIMD можно рассматривать просто как набор меньших машин SISD и SIMD .

Наконец, поскольку поток данных трансформируется по мере того, как он проходит через массив от узла к узлу, несколько узлов не работают с одними и теми же данными, что делает классификацию MISD не совсем верной. Другая причина, по которой систолический массив не должен квалифицироваться как MISD, та же, что и та, которая исключает его из категории SISD: входные данные обычно представляют собой вектор, а не отдельное значение данных (single data), хотя можно утверждать, что любой заданный вход вектор — это отдельный элемент данных.

Несмотря на все вышесказанное, систолические массивы часто предлагаются в качестве классического примера архитектуры MISD в учебниках по параллельным вычислениям и на инженерных курсах. Если массив рассматривается извне как атомарный, его, возможно, следует классифицировать как SFMuDMeR (англ. Single Function, Multiple Data, Merged Result(s)) одна функция, множество данных, объединенный результат (ы).

Систолические массивы используют предопределенный вычислительный граф потока, который соединяет их узлы. Сети процесса Кана используют аналогичный граф потока, но отличаются узлами, работающими синхронно в систолическом массиве: в сети Кана между каждым узлом есть очереди FIFO.

Подробное описание

Систолический массив состоит из матричных рядов блоков обработки данных, называемых ячейками. Блоки обработки данных (DPU) аналогичны центральным процессорам (CPU), за исключением обычного отсутствия счетчика программ[2], поскольку операция инициируется транспортом, то есть начинается сразу при поступлении объекта данных. Каждая ячейка передаёт информацию следующим за ней сразу после обработки. Систолический массив часто имеет прямоугольную форму, когда данные проходят через массив между соседними DPU, часто с разными потоками данных в разных направлениях. Потоки данных, входящие и исходящие из портов массива, генерируются модулями памяти с автопоследовательностью (англ. auto-sequencing memory units, ASM). Каждый такой модуль включает в себя счетчик данных. Во встроенных системах поток данных может также вводиться и/или выводиться во внешний источник.

Пример систолического алгоритма может быть разработан для матричного умножения. Одна матрица подается построчно с вершины массива и передается вниз по массиву, другая матрица подается по столбцу за раз с левой стороны массива и проходит слева направо. Затем фиктивные значения передаются до тех пор, пока каждый процессор не увидит одну целую строку и один целый столбец. В этот момент результат умножения сохраняется в массиве, и его становится возможно вывести построчно или по столбцу за раз, перемещаясь по массиву вниз или в сторону.[3]

Систолические массивы — это массивы DPU, которые подключены к небольшому количеству ближайших соседних DPU в топологии, подобной сетке. DPU выполняют последовательность (часто примитивных) операций с данными, которые передаются между ними. Поскольку традиционные методы синтеза систолического массива применялись на практике с помощью алгебраических алгоритмов, можно получить только однородные массивы только с линейными конвейерами, так что архитектуры во всех DPU одинаковы. Следствием этого является то, что только приложения с постоянными зависимостями данных могут быть реализованы на классических систолических массивах. Подобно SIMD машинам, синхронизированные систолические массивы делают вычисления «пошагово», когда каждый процессор выполняет поочередные вычисления/фазы общения. Систолические массивы с асинхронным рукопожатием между DPU называются массивами волнового фронта. Одним из хорошо известных систолических массивов является процессор iWarp Университета Карнеги-Меллона, который был произведен Intel. Система iWarp имеет процессор с архитектурой линейного массива, соединенный шинами данных, идущими в обоих направлениях.

Пример применения

Полиномиальная оценка

Правило Хорнера для вычисления многочлена:

Линейный систолический массив, в котором процессоры расположены попарно: один умножает свой ввод на и передает результат вправо, следующий добавляет и передает результат вправо.

Преимущества и недостатки

Плюсы

  • Быстрее, чем процессоры общего назначения
  • Масштабируемость

Минусы

  • Дорого из-за низкого эффекта масштаба
  • Требуется узкоспециализированное, специальное оборудование, которое часто зависит от применения.
  • Широко не реализовано
  • Ограниченная кодовая база программ и алгоритмов. (Не все алгоритмы могут быть реализованы в виде систолических массивов. Часто требуются нетривиальные приемы, чтобы сопоставить такие алгоритмы с систолическим массивом.)

Реализации

  • Сетевой процессор Cisco PXF внутренне организован как систолический массив.[4]
  • TPU Google также разработан на основе систолического массива.
  • Система текстового поиска Paracel FDF4T TestFinder[5]
  • Paracel FDF4G GeneMatcher Biological (ДНК и белок) поисковая система
  • Чип Inferentia в Amazon Web Services[6]
  • MIT Eyeriss — ускоритель систолического массива для сверточных нейронных сетей.[7][8]

См. также

Примечания

  1. Colossus - The Greatest Secret in the History of Computing на YouTube
  2. The Paracel GeneMatcher series of systolic array processors do have a program counter. More complicated algorithms are implemented as a series of simple steps, with shifts specified in the instructions.
  3. Systolic Array Matrix Multiplication. Дата обращения: 6 февраля 2023. Архивировано 18 января 2023 года.
  4. Cisco 10000 Series Router Performance Routing Engine Installation. Дата обращения: 3 августа 2020. Архивировано 4 июля 2016 года.
  5. About Paracel. brandprosgroup.com. Paracel. Дата обращения: 4 мая 2018. Архивировано 4 мая 2018 года.
  6. Announcing availability of Inf1 instances in Amazon SageMaker for high performance and cost-effective machine learning inference. Дата обращения: 15 августа 2020. Архивировано 28 сентября 2020 года.
  7. Eyeriss Project. eyeriss.mit.edu. Дата обращения: 21 февраля 2021. Архивировано 11 августа 2023 года.
  8. Chen, Yu-Hsin (2016-10-12). "Eyeriss: a spatial architecture for energy-efficient dataflow for convolutional neural networks". ACM SIGARCH Computer Architecture News (англ.). 44 (3): 367—379. doi:10.1145/3007787.3001177. ISSN 0163-5964. Архивировано 6 февраля 2023. Дата обращения: 6 февраля 2023.

Рекомендации

  • Х. Т. Кунг, К. Э. Лейзерсон: Алгоритмы для массивов процессоров СБИС; в: К. Мид, Л. Конвей (ред.): Введение в системы СБИС; Аддисон-Уэсли, 1979 г.
  • SY Kung: процессоры массивов СБИС; Прентис-Холл, Инк., 1988 г.
  • Н. Петков: Систолическая параллельная обработка; Издательство Северной Голландии, 1992 г.

Read other articles:

Nama ini menggunakan cara penamaan Spanyol: nama keluarga pertama atau paternalnya adalah Sánchez dan nama keluarga kedua atau maternalnya adalah Pérez-Castejón. Excelentísimo SeñorPedro Sánchez Perdana Menteri SpanyolPetahanaMulai menjabat 2 Juni 2018Penguasa monarkiFelipe VIWakilCarmen Calvo PendahuluMariano RajoyPenggantiPetahanaSekretaris Jenderal Partai Buruh Sosialis SpanyolPetahanaMulai menjabat 17 Juni 2017PresidenCristina NarbonaWakilAdriana Lastra PendahuluKomite ...

 

Letak Mirzapur dan garis bujur 82,5° BT yang digunakan sebagai acuan bagi Waktu Standar India. Waktu Standar India (Inggris: Indian Standard Timecode: en is deprecated , disingkat IST) adalah zona waktu yang digunakan di seluruh bagian India, dengan perbedaan waktu sebesar UTC+5:00. Tidak ada waktu musim panas (daylight saving time, DST) atau penyesuaian waktu musiman di India, meskipun DST pernah digunakan sebentar pada masa Perang Tiongkok-India pada tahun 1962, Perang India-Pakistan ...

 

Universitas Pendidikan GaneshaMotoDharmaning sajjana umerdhyaken widyagunaJenisPerguruan Tinggi NegeriDidirikan11 Mei 2006Lembaga indukKementerian Pendidikan, Kebudayaan, Riset, dan TeknologiRektorProf. Dr. I Wayan Lasmawan, M.PdLokasiSingaraja, Bali, Kabupaten Buleleng, IndonesiaWarna  Biru bajaSitus webwww.undiksha.ac.id Universitas Pendidikan Ganesha merupakan perguruan tinggi negeri yang berlokasi di Kota Singaraja, Bali, Indonesia. Perguruan tinggi yang menyelenggarakan pendidikan a...

العلاقات الكوستاريكية اللاتفية كوستاريكا لاتفيا   كوستاريكا   لاتفيا تعديل مصدري - تعديل   العلاقات الكوستاريكية اللاتفية هي العلاقات الثنائية التي تجمع بين كوستاريكا ولاتفيا.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدولتي�...

 

Shopping mall in Montreal, QuebecGaleries d'AnjouLocationMontreal, QuebecAddress7999 Galeries d'Anjou Blvd, Anjou, Quebec, CanadaOpening dateAugust 8, 1968DeveloperFairview CorporationManagementJLLOwnerIvanhoé CambridgeNo. of stores and services160No. of anchor tenants6Total retail floor area1,114,000 sq ft (103,500 m2).No. of floors1Parking6000Public transit access STM Bus 44, 95, 141 and 460Websitegaleriesdanjou.com Galeries d'Anjou (formerly CF Galeries d'Anjou) is a shoppi...

 

Карта хронологии вступления стран в НАТО. Расшире́ние НАТО — вступление стран в военный союз «НАТО». Вступление новых членов регулируется статьёй 10 Североатлантического договора: Статья 10 Договаривающиеся стороны по всеобщему согласию могут предлагать любому друг�...

Vous lisez un « bon article » labellisé en 2008. Pour les articles homonymes, voir Barbey d'Aurevilly (homonymie) et Barbey (homonymie). Jules Barbey d’AurevillyJules Barbey d'Aurevilly en 1882 par Émile Lévy.BiographieNaissance 2 novembre 1808Saint-Sauveur-le-Vicomte, Basse-Normandie, Empire françaisDécès 23 avril 1889 (à 80 ans)7e arrondissement de Paris, Île-de-FranceSépulture Saint-Sauveur-le-VicomteNom de naissance Jules Amédée BarbeyNationalité fran�...

 

Nine Network TV station in Newcastle, Australia This article is about the Australian television station. For the Australian broadband network, see National Broadband Network. For other uses, see NBN. NBNNorthern New South Wales & Gold CoastChannelsVirtual: 8 SD, 80 HDBrandingNineProgrammingAffiliationsNine (O&O)OwnershipOwnerNine Entertainment Co(NBN Pty Limited)HistoryFirst air date4 March 1962; 62 years ago (1962-03-04)Former affiliationsNational Television Network...

 

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: WOCN-FM – news · newspapers · books · scholar · JSTOR (November 2023) (Learn how and when to remove this message) Radio station in Massachusetts, United StatesWOCN-FMOrleans, MassachusettsUnited StatesBroadcast areaCape CodFrequency104.7 MHzBrandingOcean 104.7P...

この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています(詳細)。 数字の大字(だいじ)は、漢数字の一種。通常用いる単純な字形の漢数字(小字)の代わりに同じ音の別の漢字を用いるものである。 概要 壱万円日本銀行券(「壱」が大字) 弐千円日本銀行券(「弐」が大字) 漢数字には「一」「二」「三」と続く小字と、「壱」「�...

 

Wilayah Sheikh Jarrah. Di latar belakang, pusat kota Yerusalem. Sheikh Jarrah (Arab: الشيخ جراح, Ibrani: שייח' ג'ראח) adalah sebuah wilayah Palestina di Yerusalem Timur, yang berjarak 2 kilometer dari Kota Tua, di jalan menuju Gunung Scopus.[1][2] Wilayah tersebut mengambil nama dari makam abad ke-13 Sheikh Jarrah, seorang tabib Saladin, yang berada di wilayah tersebut. Wilayah modern didirikan pada 1865, dan secara bertahap menjadi pusat kediaman elit...

 

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

此條目可能包含不适用或被曲解的引用资料,部分内容的准确性无法被证實。 (2023年1月5日)请协助校核其中的错误以改善这篇条目。详情请参见条目的讨论页。 各国相关 主題列表 索引 国内生产总值 石油储量 国防预算 武装部队(军事) 官方语言 人口統計 人口密度 生育率 出生率 死亡率 自杀率 谋杀率 失业率 储蓄率 识字率 出口额 进口额 煤产量 发电量 监禁率 死刑 国债 ...

 

Pinacoteca Nazionale di Bologna Bien cultural italiano Una sala della pinacotecaUbicaciónPaís  ItaliaLocalidad BoloniaDirección Via Belle Arti, 56 40126Coordenadas 44°29′52″N 11°21′13″E / 44.497772, 11.353547Tipo y coleccionesTipo Arte, PinacotecaHistoria y gestiónInauguración 1802Director Elena RossoniInformación para visitantesVisitantes 49 666 (2016)[1]​Web[editar datos en Wikidata] Santa Cecilia entre otros santos, de Rafael. La Pi...

 

本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。 此條目需要編修,以確保文法、用詞、语气、格式、標點等使用恰当。 (2013年8月6日)請按照校對指引,幫助编辑這個條目。(幫助、討論) 此條目剧情、虛構用語或人物介紹过长过细,需清理无关故事主轴的细节、用語和角色介紹。 (2020年10月6日)劇情、用語和人物介紹都只是用於了解故事主軸,輔助�...

Bagian dari seri tentangLGBT       lesbian ∙ gay ∙ biseksual ∙ transgender Orientasi seksual Homoseksualitas Gay Lesbian Biseksualitas Panseksualitas Poliseksualitas Aseksualitas Aseksualitas abu-abu Queer Identitas seksual Demografi New York Indonesia Biologi Lingkungan Sejarah Garis waktu Gerakan sosial Interseks dan LGBT Kerusuhan Stonewall Komunitas LGBT Afrika-Amerika Budaya Acara terbesar Desa gay Homososialisasi Hubungan sesama jenis Kebanggaan Pawai...

 

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: 1959 in India – news · newspapers · books · scholar · JSTOR (April 2022) (Learn how and when to remove this message) List of events ← 1958 1957 1956 1959 in India → 1960 1961 1962 Centuries: 18th 19th 20th 21st Decades: 1930s 1940s 1950s 1960s 1970...

 

Lokasi di Rhode Island County Newport adalah salah satu dari lima county yang terletak di negara bagian Rhode Island, Amerika Serikat. Pada sensus 2020, jumlah penduduknya adalah 85.643 jiwa.[1] Itu juga merupakan salah satu dari tujuh region di Rhode Island. County ini dibentuk pada tahun 1703.[2] Seperti semua county di Rhode Island, County Newport tidak lagi memiliki fungsi pemerintahan (selain sebagai batas administrasi pengadilan dan wilayah sheriff). Semua fungsi terseb...

Saperdini Saperda carcharias Klasifikasi ilmiah Kerajaan: Animalia Filum: Arthropoda Kelas: Insecta Ordo: Coleoptera Famili: Cerambycidae Subfamili: Lamiinae Tribus: Saperdini Sinonim Gleneini Obereini Thomson, 1864 Obereitae Thomson, 1864 Phytoeciini Pascoe, 1864 Saperdini merupakan suatu tribus dari kumbang tanduk panjang (famili Cerambycidae) subfamilia Lamiinae..[1] Genus Genus-genus yang termasuk tribus ini meliputi: Acronioglenea Bifidunguiglenea Lin & Tavakilian, 2012 Cago...

 

City in Oregon, United States City in Oregon, United StatesHalfway, OregonCityWelcome sign, in the background are the Wallowa MountainsLocation in OregonCoordinates: 44°52′40″N 117°06′34″W / 44.87778°N 117.10944°W / 44.87778; -117.10944CountryUnited StatesStateOregonCountyBakerIncorporated1909Government • MayorNora Aspy[1]Area[2] • Total0.37 sq mi (0.96 km2) • Land0.37 sq mi (0.96&...