Főoldal bulldózer
Milyen processzor teljesítménye fejleszt? A kísérlet megkezdése előtt egy általános képletű leírja a teljesítményt, mint a termék száma végrehajtható utasítást egy órajel ciklus és a frekvenciát, amelynél a processzor működik. Most ebben a képletben megjelent, és a harmadik tényező - a magok száma. Ezért processzor fejlesztő, aki azt akarja, hogy kiadja a gyors termék erre a célra számos módon.
Azonban nem minden ilyen egyszerű. Számának növelése végrehajtható kernel számítási utasítást egy órajel - elég nagy kihívás. Klasszikus x86 kódot igényel következetes parancsok végrehajtása, ezért elérése párhuzamos feldolgozás, a processzor kell határozni a nagy blokkok elágazás-előrejelző és átrendezési utasítások végrehajtását, amely előírja, jelentős mérnöki erőfeszítést. Ebben mikroarchitektúra szövődmény befolyásolja a fizikai mérete a kristály, és vezet a korlátozásokat, ha kiépítése a magok száma. Tehát, ha a gyártó megy, hogy a nagy számú processzormagok, a mikroarchitektúra szükséges, éppen ellenkezőleg, próbálja egyszerűsítik. Ez nem könnyű, és az összes órajelen. Fogadjon a növekedés ismét szükség lesz változás a belső tömbök a processzor és a kiterjesztése a végrehajtó gázvezeték. Az eredmény a következő: a processzor által érmet nyerni a teljesítmény, a fejlesztők elég izzadság egyidejű optimalizálásának számos paraméter.
A probléma az is, hogy az egyik kiválasztott, hogyan lehet javítani a processzor teljesítményét jó lehet csak különleges esetekben. Nem minden program tud hatékonyan együttműködni a nagyszámú magot. Egyes algoritmusok nem teszi lehetővé, hogy pontosan megjósolni az átmenetek és átrendezése utasításokat. És bizonyos esetekben, a teljesítmény nem növekszik, és a növekedés órajel, mert a rendszer egy másik szűk.
Ahhoz, hogy kiválassza az optimális egyensúlyt nem könnyű, és ez tekinthető a feltétel optimum? Csak akkor tudjuk összehasonlítani a teljesítményét processzor egy véges számú program és válassza ki a leggyorsabb az adott esetben. Azonban ez nem garantálja, hogy egy másik sor vizsgálati eszközök, nem kap teljesen ellentétes értékelést. Egy ilyen hosszú bejegyzést kap itt, mert ma is megismerkedni egy új sorozat a processzorok AMD FX - a zászlóshajó termék az AMD, a jól ismert kódneve Zambezi. A lényege ennek a processzor nagyon kétértelmű mikroarchitektúra Bulldozer, amelynek sikerült összegyűjteni egy csomó jelentős unflattering vélemény. De a lényeg nem az, hogy ez nagyon rossz mikroarchitektúra. Amikor kiválasztjuk a legjobb egyensúlyt a teljesítmény, a fejlesztők elszámította magát az igényeinek leginkább a felhasználók, és tettek a „alapvető formula” a hangsúlyt a rossz tényező. Ennek eredményeként az eredeti terv a termelés nagy teljesítményű megoldásokat az új generációs ment fülig és izgatta az ígéret egy áttörés AMD szurkolók kapott nem volt, amit várt. Azt azonban, hogy ez egy komoly és objektív oka csalódás? Ezen és beszélni ebben az anyagban.
# 8673; # Hiszünk a mag nyolc vagy négy?
Míg dolgozik az új design, nagy teljesítményű processzorok, AMD úgy döntött, hogy előtérbe a magok száma. Ez egy logikus választás a tényen alapul, hogy az évek során, a többszálú szoftverek egyre több és több mikro-architektúra és design, tervezett több éves fejlesztés, kell figyelembe venni az első helyen nem a jelenlegi állapot a piacon, és a megfigyelt trendeket. A nyolc mag biztosított az alap változat az új processzor - ez az, amit az AMD és az volt, hogy meghódítsa a piacot, ami eddig csak chips, a maximális számú mag, amely korlátozott hat. (Itt csak beszélünk asztali -. A szerk.).
Ebben az esetben, hogy a régi Core mikroarchitektúra K10 fejlesztők nem akar. Nem csak azok túl nagy fizikai mérete, de mint látható a Llano, nem hajlamosak működni magas frekvenciákon után is az átutalást egy modern, 32 nm-es technológiával. Ráadásul nem támogatják számos fejlett funkciók, mint például AVX-utasításokat. Ezért építeni vosmiyadernikov AMD tett egy új mikroarchitektúra - Bulldozer. Cég tisztviselők inkább azt mondják, hogy a fejlesztési végeztük tiszta lappal, de valójában a Bulldozer magot talál egy csomó utalás a többi bemutatott idei mikroarchitektúra - Bobcat, orientált használható kompakt és energiahatékony készülékek. Azonban a kapcsolat a Bulldozer és a Bobcat - elég messze, és megemlítünk róla csak azért, hogy tegye világossá az általános elképzelés - egyesíteni sok Bulldozer viszonylag egyszerű magokat.
Ebben az esetben beszélünk nem egy primitív kombinációja egyetlen félvezető chip nyolc rendes magok. Ebben az esetben a kapott processzor lenne a nagyon alacsony egyszálú teljesítmény, és nem lenne elég komoly probléma, mert a program nem zúzás terhet több informatikai szálak, nem túl kicsi. Ezért egyrészt a magokat optimalizált működés magas órajel frekvenciát. És másodszor voltak párosítva a Dual-Core modulok képesek megosztani a forrásokat javára szolgáltatás áramlását. Az eredmény nagyon érdekes design: input része a végrehajtó szállítószalag ilyen kettős modulus - teljes és további feldolgozás dokumentum között oszlik meg a két működtető.
Alapján Bulldozer konstrukciók - hagyományosan az úgynevezett dual-modulus
Emlékezzünk, a feldolgozás modern processzor több lépésből: válogatás a x86-utasítást a cache memória, azokat dekódolni - a fordítást a belső makro művelet elvégzése, felvételi eredményeket. Az első két lépés a Bulldozer modul készült egy pár magok együtt, és további integer utasításokat teljesítenek elosztott két klaszter, magok, vagy, abban az esetben a valós aritmetika, ez általában végezzük két mag műveletek egy lebegőpontos egységet.
Bulldozer modul feldolgozására tervezett négy utasítást egy órajel ciklus és hála makrosliyaniya technológia, egyes párok x86 processzor utasítás lehet tekinteni, mint egy műveletben. Ez azt jelenti, hogy általában kétmagos Bulldozer modul kapacitása hasonló egyik alapvető modern Intel processzorok, amelyek szintén képes a négy utasítás ciklusonként és egyidejűleg is támogatja makrosliyaniya.
Úgy néz ki, mint egy funkcionális modul egység, beépített mikro-architektúra Bulldozer. Két mag már csak két egész végrehajtási egységek
Ez viszonylag alacsony komplexitású és általános feldolgozó egység a blokk lebegőpontos műveleteket. Ez magában foglalja a két 128 bites FMAC végrehajtó eszközök, amelyek kezelni 256-bites utasításokat lehet kombinálni egy egységet alkot. Úgy tűnik, hogy itt a működtető nem olyan sok, különösen ha figyelembe vesszük azt a tényt, hogy osztoznak egy pár mag. De - sokoldalúbb, mint az előző és a versengő mikro architektúrák, ahol az egyes szorzók és kiegészítőt használnak. És mert ez bizonyos esetekben, ha foglalkoznak a valós számokat, a kétmagos Bulldozer modul nyújthat hasonló, vagy még jobb teljesítményt nyújt, mint például egy mag Sandy Bridge.
Hasonló az ötlet ötvözi egy 128 bites eszközök együttműködni a 256 bites utasítások használják Sandy Bridge
Azonban a legnagyobb erőssége Bulldozer modul kell venni, amikor a kettős stream loading. Egy mag Sandy Bridge is képes feldolgozni két szál, erre ott van a Hyper-Threading technológiát. Azonban minden utasítást, amely ebben az esetben irányítja egy sor működtető, amely a gyakorlatban ad okot, hogy számos konfliktus. A Bulldozer modul megmarad két független egész szám, klaszter, amely párhuzamos végrehajtási szálakkal, és a teljes beavatkozószervek száma bennük meghaladja a száma az ilyen eszközök a magban Sandy Bridge és félszer.
Balra - a Bulldozer modul, jobb - néhány versenytárs kernel támogatja a Hyper-Threading. Tény, hogy a Sandy Bridge nem nagyon sokat, és úgy néz ki, de a probléma illusztráció közvetíti
Ennek eredményeként a Bulldozer modul egy magasabb csúcs teljesítményt nyújt, mint a mag Sandy Bridge, de hogy felfedje a teljesítmény némileg bonyolultabb. Sandy Bridge Core szellemi Feltöltés saját források köszönhetően a fejlett on-chip logikai szétszedni a egyszálú kódot, és végrehajtja azt, párhuzamosan a teljes körű a hajtóművek. A Bulldozer a probléma hatékony felhasználása működtető részben eltolódott a programozó, aki törni a kódot két áramra - a teljes letöltés Az összes modul kapacitása csak akkor lesz lehetséges, akkor.
És ez az, ami a jellemző. Figyelembe véve a kétmagos processzor Bulldozer, mi minden alkalommal hasonlították össze egymagos Sandy Bridge, és ugyanabban az időben tudtuk tölteni elég megfelelő párhuzamos. Ez elgondolkodtató - nem kellene tekinteni, mint „egy nyolc” új mikroarchitektúra termék a képzelet marketingesek? AMD az említett mag figyelembe kell venni a száma egész klaszterek, azt állítva, hogy a modul tud biztosítani akár 80% -át a teljesítmény a két független magok. De nem szabad elfelejteni, hogy a mag alátámasztása Bulldozer, sokkal egyszerűbb mag más processzorok. Ezért a száma kétmagos modulok - jellemző tükröző Bulldozer teljesítményét adott esetben.
Keresse meg a maximális processzormagok száma, és kap munkát a marketing osztályán AMD
# 8673; # Cache memória
Szervezése cache memória a Bulldozer processzorok is „kapcsolt” nem annyira az egyes magok, mint a kétmagos modulokat. Tény, hogy minden mag van emelve csak a saját cache az első szintű adatokat, az összes többi cache szint akár egy teljes modul vagy a processzor:
- Mindegyik magnak saját cache memória az első szintű adatok. Térfogata 16 KB, és az architektúra feltételezi a négy csatorna asszociativitás. Ezt a gyorsítótárat dolgozik egy algoritmust write-through, ami azt jelenti, hogy felvételét.
- Az első szintű cache a dokumentum képviseli, egy példányban, minden kettős modult. A térfogata - 64 KB és a szám az asszociatív csatornák - kettő.
- a második szintű cache is megvalósíthatók egyetlen modul például. Mérete - lenyűgöző 2 MB asszociatív - 16 csatorna, és az algoritmus - kizárólagos.
- Emellett nyolc processzor általában nagyon 8MB L3 cache egy 64 utas set asszociatív. A különlegessége ennek a gyorsítótár működése lényegesen alacsonyabb, mint a processzor által amelynek a frekvenciája mintegy 2 GHz-es.
A következő táblázat leírja az arány a cache memória processzorok térfogatú nyolc-Bulldozer, négymagos Sandy Bridge és Thuban (hat-core Phenom II X6, épült egy mikroarchitektúra K10).
Hozzájárul ahhoz, hogy a személyes adatok feldolgozása