L3 cache
Mennyire fontos L3 cache az AMD?
Sőt, érdemes felszerelni a többmagos processzorokat dedikált memóriával rendelkeznek, amelyet közösen használnak az összes rendelkezésre álló magot. Ebben a szerepben, gyors harmadik szintű cache (L3) jelentősen felgyorsítja az adatokhoz való hozzáférést, hogy kérik a leggyakrabban. Ezután a magokat, ha van ilyen lehetőség, nem kell elérni a lassú elsődleges memória (RAM, RAM).
Legalábbis elméletben. A közelmúltban, az AMD bejelentette az Athlon II X4 processzor, ami egy modell Phenom II X4 nélkül L3 cache, utalva arra, hogy ez nem így van, és szüksége. Úgy döntöttünk, hogy közvetlenül összehasonlítani a két processzor (és anélkül L3 cache), hogy ellenőrizze a cache befolyásolja a teljesítményt.
Hogyan működik a cache?
Mielőtt belevetik magukat a teszteket, fontos megérteni bizonyos alapokat. A működési elve igen egyszerű cache. Cache-pufferek az adatokat a lehető legközelebb a számítástechnikai processzormag hogy csökkentse a CPU igények hosszabb és lassabb memóriát. Modern asztali platform cache hierarchia akár három szinten, hogy megelőzik a hozzáférést a RAM. És a második cache és különösen tercier szolgálnak nemcsak adatpufferelését. Céljuk, hogy a túlterhelés megelőzésére a processzor buszon, amikor a magok információkat kell cserélnie.
Találat és balesetveszélyes
A hatékonysága cache architektúra által mért százalékos találatot. Információkérés, amely lehet elégedett a cache tartják találatot. Ha a gyorsítótár nem tartalmazza a szükséges információkat, a kérelmet lejut a csővezeték memóriát, és szerzett egy hiányzik. Természetesen megcsúszik eredményezi a szükséges időt, hogy megkapja. Ennek eredményeként, használati pipelining jelenik meg „buborékok” (idle) és a késleltetés. Hit, éppen ellenkezőleg, lehetővé teszi, hogy a maximális teljesítményt.
Írási gyorsítótár, az exkluzivitás, a koherencia
helyettesítési politika diktálja, hogy a cache felszabadított hely az új felvételek. Mivel az adatok írása a cache, előbb-utóbb meg kell jelennie a fő memória, a rendszer meg tudja csinálni egyszerre a bejegyzést a cache (write-through), vagy megjelölheti ezeket a területeket a „piszkos” (write-back), és írjuk a memóriába mikor lesz kényszerült a gyorsítótárból.
Ezek több szintű cache tárolhatók kizárólagosan, azaz anélkül, redundancia. Akkor nem fogja megtalálni ugyanazokat az adatokat vonalak két különböző hierarchikus cache. Vagy cache működhet bezárólag, azaz az alacsonyabb szintű cache garantáltan adatokat tartalmaznak, amely jelen van a felső szint cache (közelebb a processzor mag). Az AMD Phenom használ exkluzív L3 cache, míg az Intel követi a befogadó cache stratégia. koherencia protokoll kövesse az integritás és relevanciája az adatokat a különböző magok szintje cache és még processzorok.
A nagyobb mennyiségű cache több adatot képes tárolni, de ugyanakkor van egy egyre növekvő késések. Ezen kívül nagy mennyiségű cache fogyaszt jelentős mennyiségű processzor tranzisztorok, ezért fontos, hogy megtalálja az egyensúlyt a „költségvetés” tranzisztorok, kristály mérete, az energiafogyasztás és a teljesítmény / késleltetést.
Felvétel a memóriában lehet csatolni a cache közvetlenül (direkt-leképezett), azaz, egy másolatot az adatok, csak egy elem a gyorsítótárban a fő memória, vagy lehetnek társítva egy n-szintű (n-utas asszociatív), azaz, van N lehetséges helyszín a cache, ami pedig az adatokat. A nagyobb fokú asszociativitás (akár teljesen asszociatív cache) biztosítja a legjobb caching rugalmasságot, mivel a meglévő adatokat a cache nem szükséges átírni. Más szóval, a nagy n-asszociatív biztosít nagyobb százalékban találatot, de a késés növeli, mivel több időt igényel, hogy ellenőrizze ezeket a szövetségeket, hogy elérje. Általános szabály, hogy a legnagyobb mértékben az egyesülési ésszerű az utolsó szintű cache, mivel a maximális kapacitás áll rendelkezésre ott, és a keresési adatokat kívül a cache vezet a kezelés lassú processzor RAM.
Néhány példa: y Core i5 és i7 használatra 32KB L1 cache 8-utas meghatározott asszociatív adatok és 32 Kbyte L1 cache 4-utat a dokumentumot. Az Intel megértsék a vágy, hogy az utasítások rendelkezésre álltak gyorsabban, és L1 cache adatok maximális százaléka találatot. L2 cache, Intel processzorok 8-utas szett asszociatív, és L3 cache, Intel „intelligensebb”, mert a 16-utas asszociatív, hogy a lehető legjobb eredményt.
Azonban AMD következik egy másik stratégiát a processzorok Phenom II X4, amelyek használják az L1 cache-2-utas asszociatív meghatározott késedelmek csökkentése. Ahhoz, hogy kompenzálják az esetleges gyorsítótárhibákat kapacitás megduplázódott: 64 KB adat és 64 KB utasítás. Az L2 gyorsítótár 8-utas asszociatív, mint az Intel design, de az L3 gyorsítótárral, AMD együttműködik 48 utas asszociatív. De a döntés a választás egy adott cache architektúra nem lehet értékelni tekintet nélkül a teljes CPU architektúra. Persze, az a gyakorlati jelentősége van, a vizsgálati eredmények és a célunk az volt, csak egy gyakorlati tesztje mindez összetett, több szintű cache struktúrát.