Вишејезгарни процесор је једна рачунарска компоненета са две или више независних стварних централних процесорских јединица (названих “језгра”), а те јединице читају и извршавају програмске инструкције. [тражи се извор] Инструкције су обичне CPU инструкције као сабирање, покретање података и гранање, али вишејезгарни процесори могу да извршавају више инструкција у исто време, повећањем укупне брзине за програме који подлежу паралелном рачунању.[тражи се извор] Произвођачи обично интегришу језгра на једно интегрисано коло (познато као вишепроцесорски чип или CMP), или на више чипова унутар једног паковања чипа.
Процесори су се првобитно развили само са једним језгром. Двојезгарни (Dual-core) процесор има два језгра (нпр. AMD Phenom II X2, Intel Core Duo), quad-core процесор садржи четири језгра (нпр. AMD Phenom II X4, Intel-ов quad-core процесор, види i5 и i7 на Intel Core), 6- core процесор садржи шест језгара (нпр. AMD Phenom II X6, Intel Core i7 Extreme Edition 980X), 8-core процесор садржи осам језгара (нпр. Intel Xeon E7-2820, AMD FX-8350), 10-core садржи десет језгара (нпр. Intel Xeon E7-2850), 12-core процесор садржи дванаест језгара. Вишејезгарни процесор имплементира мултипроцесовање на једном физичком паковању. Дизајнери могу упарити језгра у вишејезгарни уређај чврсто или лабаво. На пример, језгра могу или не могу делити кеш, и они могу да имплементирају преношење поруке или дељење меморије унутар језгара комуникационих метода. Заједничка мрежа топологије која повезује језгара укључује магистралу, прстен, дводимензионалну мрежу и crossbar. Хомогени вишејезгарни системи укључују само идентична језгра, хетерогени вишејезгарни системи имају језгра која нису идентична. Као и код јено-процесорског система, језгра у вишејезгарним системима могу имплементирати архитектуру такву као суперскаларну, VLIW, векторску обраду, SIMD или вишенитно.
Вишејезгарни процесори имају широку употребу у многим областима примене, укључујући општу намену, уграђеност, мреже, дигиталну обрада сигнала (DSP) и графику.
Побољшање перформанси добијено коришћењем вишејезгарног процесора доста зависи од коришћених алгоритама софтвера и њихове имплементације. Посебно, могући добици су ограничени од делова софтвера који се могу извршавати паралелно истовремено на више језгара; овај ефекат се описује помоћу Amdahl-овог закона. У најбољем случају, такозвани паралелни неометани проблеми могу реализовати факторе убрзања близу бројних језгара, али још више ако је проблем довољно подељен да може стати у сваки кешов кеш, чиме се избегава коришћење много спорије главне меморије. Већина апликација, мађутим, неће се значајно убрзати сем ако програмер уложи довољну количину напора у поновно рефакторисање проблема.[1] Паралелизација софтвера је значајна тема у току истраживања.
Терминологија
Број језгара
Уобичајено име
1
single-core
2
dual-core
3
tri-core triple-core
4
quad-core
5
penta-core
6
hexa-core
7
hepta-core
8
octa-core, octo-core
9
nona-core
10
deca-core
11
hendeca-core
12
dodeca-core
13
trideca-core
14
tetradeca-core
15
pentadeca-core
16
hexadeca-core
17
heptadeca-core
18
octadeca-core
19
enneadeca-core
20
icosa-core
Термин вишејезгарни или двојезгарни углавном се односи на неку врсту централне процесорске јединице (CPU), али се понекад такође примењује и на процесоре дигиталних сигнала (DSP) и систем-на-чипу (SoC). Термин се обично користи само да упути на вишејезгарне микропроцесоре који су произведени на истом чипу интегрисаног кола; одвојени микропроцесорски чипови на истом пакету се обично називају другим именом, као више-чиповни модули. Овај чланак користи термине “вишејезгарни” и “двојезгарни” за CPU производњу на истом интегрисаном колу, осим ако није другачије речено.
За разлику од вишејезгарних система, термин multi-CPU се односи на више физички раздвојених процесорских јединица (које често садрже посебна кола да олакшају мођусобну комуникацију).
Термини many-core и massively multi-core се понекад користе да се опише вишејезгарна архитектура са посебно великим бројем језгара (десетине или стотине).[2]
Неки системи користе доста меких микропроцесорских језгара постављених на један FPGA. Свако “језгро” може се сматрати као "semiconductor intellectual property core" (полупроводничка интелектуална својина језгра) као и CPU језгро.
Развој
Док се технологија производње побољшава, смањење величина индивидуалних капија, физичка ограничења микроуређаја базираних на полупроводницима су постала важна дизајнерска брига. Ова физичка ограничења могу проузроковати значајно расипање топлоте и пробелма у синхронизацији података. Разне друге методе се користе за побољшање CPU перформанси. Неки instruction-level parallelism (ILP) (инструкциони нивои паралелизма) као суперскаларни pipeline је погодан за многе апликације, али није ефикасан за оне које садрже код тежак-за-предвиђање. Многим апликацијама више одговара метод паралелизма на нивоу нити (TLP), и више независних CPU се обично користи за убрзање система. Комбинација повећаног расположивог простора (због префињених процеса производње) и повећана потражња за TLP довела је до развоја вишејезгарних процесора.
Комерцијални подстицаји
Неколико пословних мотива довело је до развоја двојезгарне архитектуре. Деценијама, било је могуће повећавати перформансе процесора помоћу смањења простора између интегрисаних кола, који је оборио цену по урађају на IC. Алтернативно, за исту површину кола, могло је више транзистора да се употреби у дизајну, што је повећало функционалност, посебно за CISC архитектуру. Такт је такође порастао за редове величине у деценијама крајем 20. века, од неколико мегахерца и 1980. године на неколико гигахетца и раним 2000-им годинама.
Док се вредност брзине генератора такта побољшавала успорено, повећавала се употреба паралелног израчунавања у облику вишејезгарних процесора који су тежили да побољшају укупне перформансе обраде. Више језгара се користило на истом CPU чипу, који онда може да доведе до боље продаје CPU чипова са два или више језгара. Intel је произвео процесор са 48 језгара за истраживање у облаку; свако језгро је имало Х86 архитектуру.[3] Intel је оптеретио Linux на свако језгро.[4]
Технички фактори
Пошто су произвођачи рачунара дуго имплементирали симетричан мултипроцесорски (SMP) дизајн коришћењем дискретних процесора, питања у вези имплементирања вишејезгарне архитектуре и њеног подржавања са софтвером су добро позната.
Додатно:
Употреба доказаних процесорских језгара без промена архитектуре значајно смањују дизајнерски ризик.
За процесоре опште намене, велики део мотивације за вишејезгарни процесор долази из веома смањеног добитка у перформансама процесора са повећањем радне фреквенце. То је због три основна фактора:
#Меморијски зид; повећање у разлици перформанси између процесора и меморије. Овај ефекат гура величине кеша у ред да би се маскирала латенција меморије. Ово помаже само у мери да меморијски опсег није уско грло у перформансама.
#ILP wall; повећање тешкоће проналажења довољних паралелизама у једном инструкцијском стриму да задржи високо-перформансни једнојезгарни процесор заузетим.
#power wall; тренд трошења експоненецијалног повећања снаге са сваким факторијалним повећањем радне фреквенције. Ово повећање може се постићи “сужавањем” процесора коришћењем мањих трагова за исту логику. Роwer wall представља производњу, системски дизаин и развојни проблеми који нису били у светлу мањег добитка у перформансама због меморијског зида и ILP wall.
Да бу наставили ипоруку редовног побољшања перформансама за процесоре опште намене, произвођачи као што су Intel and AMD окренули су се ка вишејезгарном дизајну, жртвујући мању цену производње за веће перформансе у неким апликацијама и системима. Вишејезгарна архитектура су развијена, али се развијају и алтернативе. Посебно јак кандидат који ће завладати тржиштем имаће интегрисане периферијске функције на чип.
Предност
Близина више CPU језгара на истом чипу дозвољава да кеш кохеренција кола ради на много већем генераторском такту него што је могуће ако сигнали путују ван чипа. Комбинујући еквивалентне процесоре на једном чипу значајно побољшавамо перфорамнсе кеш snoop (алтернатива: магистрални snooping) операција. Једноставно речено, ово значи да сигнал између различитих процесора прелазе мању раздаљину, па се зато сигнали мање деградирају. Ови сигнали високог квалитета омогућавају слање више података у датом временском периоду, пошто индивидуални сигнали могу бити краћи и не морају да се често понављају.
Претпостављајући да чип може стати у једно паковање, физички, вишејезгарни процесорски дизајни захтевају много мање простора за плоче са штампаним колом (PCB) него SMP дизајни са више чипова. Такође, двојезгарни процесор троши мање енергије него два упарена једнојезгарна процесора, углавном због смањене енергије која се захтева за довођење сигнала са споља на чип. Шта више, језгра деле нека кола, као L2 кеш и интерфејс на спољној страни магистрале (front side bus - FSB). У погледу конкурентних технологија за расположиви силицијум на чипу, вишепроцесорски дизајн може да користи доказане CPU језгране библиотеке дизајна и производњу уређаја са мањим ризиком од грешке дизајна него смишљање новог ширег језгарног дизајна. Такође, додавање кеша има мању зараду.
Вишејезгарни чипови омогућавају веће перформансе са мањом енергијом. Ово може бити важан фактор за мобилне уређаје који раде на батерије. Пошто свако језгро у вишејезгарном је генерално енергетски ефикаснеје, чип постаје ефикаснији него ако има једно велико монолитно језгро. Ово омогућава веће перформансе са мење енергије. Изазов писања паралелног кода јасно поништава ову погодност.[5]
Недостаци
Максимизирање коришћења комјутерског ресурса омогућено са вишејезгарним процесором захтева подешавање и у подршци оперативног система (ОС) и у постојећима апликационим софтверима. Такође, могућност вишејезгарног процесора да повећа перформансе апликација зависи од коришћења више нити унутар апликације. Ситуација се побољшава: на пример Valve Corporation's Source engine нуди вишејезгарну подршку,,[6][7] а Crytek се развио сличну технологију за CryEngine 2 који покреће њихову игру, Crysis. Emergent Game Technologies' Gamebryo engine укључује њихову Floodgate технологију,[8] која поједностављује вишејезгарно развијање за играчке платформе. Додатно, Apple Inc.'s OS X, почиње са Mac OS X Snow Leopard, и iOS почиње са iOS 4, имају уграђену вишејезгарну инсталацију названу Grand Central Dispatch.
Интеграција вишејезгарног чипа ствара смањен принос у производњи чипова и они су тежи за топлотно управљање него једнојезгарни чип мање густине. Intel се делимично супротставио првом проблему тако што је направио четворојезгарни дизајн спајањем два двојезгарна на један чип са заједничким кешом, дакле било која два двојезгарна чипа се могу користити, насупрот производњи четири језгра на једном чипу и да се захтева да сва четири раде да би био четворојезгарни. Са архитектонске тачке гледишта, на крају, једино процесорски дизаин може боље да искористи силиконску површину него мултипроцесорска језгра, па опредељени развој овој архитектури може носисти ризик од застаревања. Коначно, сирова снага процесора није једино ограничење за перформансе система. Два процесорска језгра деле исту системску магистралу и моморијски пропусни опсег лимитира стварне предности у перформансама. Потврђено је да ако је једно језгро близу меморијског пропусног опсега, онда ће двострука-језгра дати од 30% до 70% побољшања; ако мемеоријски пропусни опсег није проблем, онда се може очекивати побољшање од 90%; међутим, Amdahl-ов закон чини ову тврдњу сумњивом.[9] Било би могуће да су апликације које користе два процесора у завршном процесу брже на двоструком језгру ако комуникација између процесора није лимитирајући фактор, што би било више него 100%-но побољшање.
Хардвер
Трендови
Општи тренд у развоју прецесора је прешао из дво-, тро-, четворо-, шесто-, осмојезгарни чипови у њима са десетинама или чак стотинама језгара. Поред тога, вишејезгарни чип помешан са мултитредингом, меморијом-на-чипу и наменским хетерогеним језгрима обећавају даље добитке у перформансама и већој ефикасности, посебно у обради мултимедија, препознавања и мрежних апликација. Постоји такође и тренд побољшања енергетске ефикасности кроз фокусирање на потрошњу-по-вату са напредним прецизним-зрном или ултра прецизним управљањем напајања и динамичка волтажа и фреквенционо скалирање (тј. лаптоп рачунари и преносиви медија плејери).
Архитектура
Састав и равнотежа језгара у вишејезгарном процесору показује велику разноврсност. Неке архитектуре користе један дизаин језгра који се константно понавља (“хомогени”), док друге користе мешавину различитих језгара, свако оптимизовано за другачију “хетерогену” улогу.
Чланак “CPU дизајнери раправљају о будућности више језгара” од Rick Merritt, EE Times 2008,[10] укључују ове коментаре:
Chuck Moore [...] је предложио да рачунари треба да буду више попут мобилних телефона, који користе различита специјализована језгара за покретање модуларног софтвера одређеним програмским интерфејс апликацијама на високом нивоу.
[...] Atsushi Hasegawa, виши главни инжињер из Renesas, се генерално слаже. Он је предложио да мобилни телефони користе многа специјализована језгра која раде у спрези су добрим моделом за будући вишејезгарни дизајн.
[...] Anant Agarwal, оснивач и извршни директор за покретање Tilera, заузео је супротни став. Он је рекао да вишејезгарни чипови треба да буду хомегена колекција језгара опште намене да би модел софтвера био једноставан.
Софтверски утицај
Застарела верзија антивирус програма може да створи нову нит за скенирање, док GUI нит чека команду корисника (нпр. прекидање скенирања). У том случају, вишејезгарна архитектура је од мале користи за саму апликацију због једне нити која ради тешке задатке и немогућности да се равномерно распореди на сва језгара. Програмирање правог вишенитног кода често захтева комплексну координацију нити и може лако да створи суптилне и тешке-за-проналажење грешке због преплитања процеса на подацима које деле нити (thread-safety). Због тога, такав код је много тежи за дибаговање него једнонитни код, када он одмара. Био је приметан недостатак мотивације за писање нитних апликација за потрошаче због релативне реткости потражње максималног искоришћена хардвера код потрошача. Иако су вишенитне апликације направиле малу додатну казну за перформансе једнопроцесорских машина, додатну горњу производњу било је тешко оправдати због преваге једнопроцесорских машина. Такође, серијски задаци попут декодирања ентропије кодираних алгоритама који се користе у видео кодецима нису могућа да се паралелизују зато што сваки генерисани резултат служи за помоћ при стварању новог резултата ентропије декодованих алгоритама.
Имајући у виду све већи нагласак на дизаин вишејезгарних чипова, који проистичу из термичких проблема и проблема потрошње енергије даљим значајним повећањем брзине процесорског генератора такта, опсег у којој софтвер може бити вишенитни да искористи предност нових чипова је вероватно највеће ограничење на перформансе рачунара у будућности. Ако програмери не буду у стању да дизајнирају софтвер који може у потпуности да искористи ресурсе омогућене од стране више језгара, онда ће они на крају достићи непремостиву границу у перформансама.
Тржиште телекомуникација је било једно од првих коме је био потребан нови дизајн за паралелно процесирање datapath пакета, јер је постојало брзо усвајање вишејезгарних процесора за datapath и контролни панел. Ови MPUs ће заменити[11] традиционалне мрежне процесоре који су базирани на власничком микро- или пико-коду.
Технике паралелног програмирања могу имати директну корист од вишејезгарног процесора. Неки постојећи модели паралелног програмирања су Cilk Plus, OpenMP, OpenHMPP, FastFlow, Skandium, MPI и Erlang који могу бити коришћени на вишејезгарним платформама. Intel је представио нову апстракцију за C++ паралелизам и назвао је TBB. Други истраживачки напори укључују Codeplay Sieve System, Cray's Chapel, Sun's Fortress и IBM's X10.
Вишејезгарна обрада је такође утицала на способност развоја модерног рачунарског софтвера. Развијачи програмирања у новијим језицима могу пронаћи да њихови модерни језици не подржавају вишејезгарну функционалност. Онда ово захтева употребу нумеричких библиотека за приступ коду написаном у језику C и Fortran, који обављају математичке прорачуне брже од новијих језика као што је C#. Intel-ови MKL и AMD's ACML су написани у овим матерњим језицима и користе предност вишејезгарног процесора. Балансирање оптерећења апликација на процесорима може бити проблематично, нарочито ако имају различите перформансне карактеристике. Постоје различити концептуални модели који се баве проблемима, на пример који користе координацију језика и програмске градње блокова (програмска библиотека и/или функције вишег реда). Сваки блок може имати другачију изворну имплементацију за сваки тип процесора. Кориснички једноставан програм који користи ове апстракције и интелигентни компајлер бирају најбољу имплементацију у зависности од контекста.[12]
Управљање конкурентности стиче главну улогу у развоју паралелених апликација. Основни кораци у пројектовању паралелне апликације су:
Партиционисање
Фаза партиционисања у дизајну има за циљ да изложи могућности за паралелно извршавање. Отуда, фокус је на дефинисању великог броја малих задатака с циљем да се добије оно што се назива финогранулирано разлагање проблема.
Комуникација
Задаци генерисања помоћу партиционисања су намењени за упоредно извршење али не могу, генерално, да се изврше независно. Обављање израчунавања у једном задатку обично ће захтевати податке везане са другим задатком. Подаци се онда морају пренети између задатака како би се омогућио наставак рачунања. Овај ток информација је дефинисан у фази комуницирања дизајна.
Нагомилавање
У трећој фази, развој креће од апстрактног према конкретном. Програмери преиспитују одлуке у фази партиционисања и комуникацији у циљу добијања алгоритма који ће се ефикасно извршавати у некој класи паралелног рачунара. Посебно, програмери разматрају да ли је корисно да се комбинују, или нагомилају, задаци идентификовани у фази партиционисања, како би се смањио број задатака, сваки веће величине. Они такође одређују да ли вреди да се реплицирају подаци и/или обрачунају.
Мапирање
У четвртој и последњој фази дизајна паралелних алгоритама, програмери одређују где ће се сваки задатак извршити. Овај проблем мапирања се не јавља код једнопроцесорског система или на рачунарима са дељеном меморијом која обезбеђује аутоматско распоређивање задатака.
С друге стране, са стране сервера, вишејезгарни процесори су идеални зато што омогућавају корисницима да се истовремено повежу на сајту и да имају независне нити за извршавање. Ово омогућава Веб серверима и апликационим серверима да имају много већи проток.
Лиценцирање
Типично, приватни предизеће-сервер софтвер је лиценциран “по процесору”. Када је CPU био процесор и када је већина рачунара имала само један CPU, није било нејасноћа.
Microsoft је изјавио да ће третирати сокет као један процесор.[13]
Oracle рачуна AMD X2 или Intel dual-core CPU као један процесор али има други начин бројања ја друге типове, посебно за процесоре са више од два језгра. IBM и HP рачунају мулти-чип модул као више процесора. Ако би мулти-чип модули бројали као један процесор, произвођачи CPU-а би имали подстицај да споје велике мулти-чип модуле па би њихови купци уштедели на софтверу.
Примери хардвера
Комерцијални
Adapteva Epiphany, је више језгарна архитектура са до 4096 процесора на чипу
Aeroflex Gaisler LEON3, вишејезгарни SPARC који постоји и у верзији отпорној да квар
Ageia PhysX, вишејезгарна физичка процесорска јединица
Phenom II, дво-, тро-, четворо-, честојезгарни стони процесор.
Sempron X2, двојезгарни процесор улазног нивоа
Turion 64 X2, двојезгарни лаптоп процесор
Radeon и FireStream вишејезгарни GPU/GPGPU (10 језгара, 16 5-издаје широк суперскаларни стрим процесора по језгру
Analog Devices Blackfin BF561, симетрични двојезгарни процесор
ARM MPCore је потпуно синтетизован вишејезгарни контејнер за ARM11 MPCore and ARM Cortex-A9 MPCore процесорска језгра, намењен за високу перформансу уграђених апликација и апликација за забаву
Sony/IBM/Toshiba's Cell процецор, деветојезгарни процесор са једном генералном употребом PowerPC језгро и осам специјализованих SPUs (Synergystic Processing Unit) оптимизованих за векторске операције које се користе у Sony PlayStation 3
Infineon Danube, двојезгарни, MIPS-based, home gateway processor.