superpipelined struktúra

A hatékonyság a szállítószalag közvetlen függés a gyakoriság, amellyel a bemeneti adatokat szolgáltatott. Elérése n szeres növekedése a működési sebesség a szállítószalag lehetséges két módon:

particionálás minden csővezeték szakasz a kisebb, miközben növeli órajelen;

fordult a processzor több csővezetékek párhuzamosan működnek.

Sajnos, a nyereség elérni, mivel superkonveyerizatsii, a gyakorlatban ez lehet spekulatív. A hosszú gázvezeték növeli a valószínűségét, konfliktusokat. Egyre drágább az átmenet becslési hiba. Ha a megszakítás programot szállítószalagok viselkednek kok szekvenciális szerkezet, a teljes csővezeték megtisztítjuk, és megtöltjük. Gyakori megszakítását és kapcsolási programok jelentősen csökkenti a termelékenységet superpipelined struktúrákat. Érdekes megjegyezni, hogy az Intel ® processzor Itanium ® szállítószalag 10 lépésenként, míg az Intel ® Itanium ® 2-8-E szakaszban .. \ Diák \ Itan.ppt.

szuperskalár processzorok

Miután A vektor bejuttatása processzorok osztály ismertté vált hagyományos processzorok skalár. A következő lépés a fejlesztés a skalár processzorok vezetett a megjelenése a név szuperskalár.

Superskalyarnymi1 nevű processzorok végre egyidejűleg több skalár parancsot. (Zilker) Ezt úgy érjük el, hogy az az összetétel több, egymástól független processzor funkcionális blokkok, amelyek mindegyike felelős az osztály a műveletek és a processzor lehet jelen több példányban. Szuperskalár párhuzamos működése feltételezi a maximális számú végrehajtási egységek csak akkor lehetséges, ha mind a többszörös skalár utasításokat. Ezt úgy érjük el, hogy a processzor „úgy néz ki” közeledik a teljesítményt a csapat, és kiválasztja az egyik ilyen szekvenciákat tartalmaznak, amelyek párhuzamosan hajtjuk végre. Szuperskalár jól pipeline, kívánatos, hogy több szállítószalagok, például két vagy három egy szuperskalár processzor. Szuperskalár és superpipelined nem mond ellent egymásnak, és a legtöbb modern processzorok hajtják végre, és hogy a másik. Meg kell jegyezni, hogy ellentétben a szerkezet egy szállító, a struktúrák több szállítószalag minden ciklusban van szükség, hogy mintát több mint egy csapat, és ez nagyon hasonlít a VLIW szerkezetét. Szuperskalár processzorok végre utasításszintû párhuzamosság.

hyperthreading technológia

Hyperthreading technológia (Hyper-ThreadingTechnology. HTT) hozta létre az Intel, hogy javítsa a termelékenységet és a hatékonyságot a kiszolgáló rendszerek. Ez a technológia között valami többszálú feldolgozás megvalósított többprocesszoros rendszerek és párhuzamosságát az utasítás szinten valósul egyprocesszoros rendszerben. Általánosságban elmondható, hogy a HTT vált forma szinkron multicast technológia, ahol a több szál által létrehozott szoftverek is végre lehet hajtani egyszerre egy processzor. A megvalósított Hyper-Threading párhuzamosság elve képes feldolgozni utasításokat technológiák párhuzamos (nem szekvenciális) művelet, azaz a kezelésére minden utasítást vannak osztva két párhuzamos adatfolyamot. Ez lehetővé teszi az egyidejű feldolgozását két különböző alkalmazások, vagy két különböző alkalmazás egy áramlás, és ezáltal növeli a processzor teljesítményét. A konstruktív szempontjából processzor Hyper-Threading technológia két logikai processzor, amelyek mindegyike a regiszterek és egy megszakítás-vezérlő. Ez azt jelenti, hogy két párhuzamos végrehajtható feladatokat dolgoznak saját, független nyilvántartások és a megszakításokat, hanem használja ugyanazt a CPU erőforrásokat feladataik ellátásához. Aktiválás után, minden egyes logikai processzor tud önállóan és egymástól függetlenül a többi processzor a feladatát, megszakítás feldolgozás, vagy blokkolt. Így az igazi kettős konfiguráció az új technológia csak abban különbözik, hogy a két logikai processzort azonos erőforrások végrehajtó egy és ugyanazon megoszlik a két patak cache memória és ugyanaz a rendszer busz. Hyper-Threading technológia Az ötlet szorosan kapcsolódik a mikro-processzor NetBurst Pentium 4 és bizonyos értelemben a logika.

Vegyünk egy hipotetikus processzort tartalmaz, ahol négy végrehajtó egységet, két aritmetikai logikai egység dolgozik egész (ALU), egy blokk használata a lebegőpontos (FPU), és egy egység írási és olvasási adatokat a memóriában (Store / Load, S / L). Tegyük fel, sőt, az egyes műveleteket hajtunk végre egy órajel ciklusra. Feltételezik továbbá, hogy a program végrehajtása, amely három utasítások: az első két - aritmetikai műveletek egész számokkal, és az utolsó Save eredményeket. Ebben az esetben, a teljes programot kerül végrehajtásra két ciklusban a processzor: az első ciklusban, hogy működik két processzor egység ALU (piros négyzet ábrán. 16), a második - a felvétel egység és a kiolvasott adatok S / L memória. A modern alkalmazások bármikor, mint általában végzett nem egy, hanem több feladatot vagy több szálat (szálak) a probléma. A 17. ábra a viselkedését egy hipotetikus processzor a teljesítmény a két különböző áramokat a feladatok. Red négyzetek megfelelnek a használatát végrehajtási egységek a processzor által egy szál, és a kék négyzetek - egy. Ha mindkét áramot végre elszigetelten, a végrehajtása az első és a második áramlási lenne szükség öt órajel ciklus (lásd. 17. ábra). Az egyidejű végrehajtása két stream processzor folyamatosan közötti váltáshoz két stream, tehát egy ciklusban a processzor utasítások végrehajtása csak egyike a patakok. A végrehajtás mindkét áram is szükség van tíz feldolgozási ciklusok (18. ábra).

és

superpipelined struktúra
superpipelined struktúra
superpipelined struktúra
Az a szám, hogy minden ciklusban nem használja fel a végrehajtási egységek, és van egy lehetőség, hogy összekapcsolják a különböző patakok parancs végrehajtását az egyes ciklusokban, természetesen, ha a hullámok ne használja ugyanazt a blokkot, a 17. ábrán látható

A fenti példa idealizált. A való világban a tökéletes kombináció kiderül, hogy nem mindig vannak konfliktusok szálak között próbál egyszerre használni ugyanazt az erőforrást. Nyilvánvaló, hogy ebben az esetben, egy szál várni források. Példa egy ilyen helyzet látható a 20. ábrán, nyilvánvaló, hogy ez lesz hét ciklus, öt helyett, mint az ideális, de nem tíz, mint a soros feldolgozás.

Kapcsolódó cikkek