Hátrányai a klasszikus grafika csővezeték
Története GPU még mindig ment egy irányba - számának növelése csővezetékek. A „szállítószalag” stabil, de ez nem tekinthető szigorúan technikai jellegű kifejezés. Az a tény, hogy a GPU használ különböző szállítószalagok hogy végezzen a különböző funkciók egymástól. Ebben az értelemben a helyesebb beszélni a vertex és pixel csővezetékek, de nem minden szállítószalagok. Korábban, a szállítószalag megérteni pixel processzor, amelyet csatlakoztatva annak textúraleképezési egység (TMU). Például, ha a grafikus processzor (GPU) használt nyolc pixel processzorok, amelyek mindegyike össze van kötve a készülék TMU, azt mondjuk, hogy a GPU nyolc csővezetékek. Ugyanakkor, azonosítja a száma csővezetékek száma pixel shader processzorok nem teljesen helyes, mivel pipelining vonja maga után nem csak a pixel, de a csúcsok, és ezért szükséges, hogy figyelembe véve a több vertex processzorok. Ezért a száma csővezetékek működhet megfelelő tulajdonságokkal GPU csak ha a szám a szállítószalagok, ahány pixel és vertex processzorok, TMU egységeket, vagyis amely az egyes szállítószalag magában foglal egy vertex és pixel processzorok, valamint egy egység TMU. Ugyanakkor ez a megközelítés, hogy a GPU architektúra nem tekinthető optimálisnak. Az a tény, hogy az ilyen lineáris szállítószalag szervezet azt jelenti, még terhelés elosztása között egyes szakaszait a gázvezeték. Ugyanakkor a valós alkalmazások a terhelés az egyes blokkok a GPU eltérő lehet. Részben megoldja optimalizálási probléma a grafikus processzor terhelés lehetővé teszi ezt az építészet, amelyben a képpontok száma processzorok nem egyezik száma vertex processzorok. Ugyanakkor, a fejlesztők meg kell keresni a középutat száma vertex és pixel processzorok.
Nyilvánvaló, hogy ebben az esetben beszélni a klasszikus szállítószalag nem egészen helyes.
Például, a hat vertex processzor 16 és a pixel processzorok NVIDIA GeForce 6800 GPU. Mind a feldolgozók 16 pixel blokk két pixel programok és egy textúra egység TMU. Ha az első pixel programok egyes száll végezhet mind aritmetikai műveletek és az olvasás textúra és normalizáció, a második aritmetikai egység csak korlátozott mértékű. Más szóval, az első blokk kapcsolódik a textúrák. Ha az egység nem folytat texturálás, hogy képes elvégezni (ebben a szakaszban) pixel árnyékoló. A második mindig rendelkezésre pixel árnyékolás.
Történelmileg, számos csővezetékek a GPU néven közismert száma pixel processzorok (bár ez nem teljesen helyes). Az ellenérték az architektúra NVIDIA GeForce 6800, valamint számos más GPU, egy ilyen megközelítés elfogadható, de egy ilyen szervezet csak részben oldja meg a problémát, hogy kiegyensúlyozzák a terhelés a GPU. A következő lépés ebben az irányban, ATI javasolta megy a moduláris, töredezett építészet grafikus processzor család ATI Radeon X1000.
Vegyük például egy képalkotó eljárás a Radeon X1800 ATI grafikus processzor.
Az első lépés meglehetősen hagyományos - egy adatfeldolgozó vertex processzorok számító háromdimenziós kép geometria. Ebben a lépésben az adatok (Vertex Data) processzorokat kezeli nyolc csúcs (Vertex Shader Processor).
Kiszámítása után vertex geometria darabka rejtett felületek, vágás, stb adatok belép a szerelési egység (setup motor), amely tartalmaz egy egységet a raszterizációs a geometria, majd - az adatok eloszlása processzor Ultra-Threading Dispatch processzor. Ez az új elosztó egység lehetővé teszi számunkra, hogy beszélni a koncepció több szálon GPU architektúra. forgalmazás processzor Ultra-Threading Dispatch Processor shader kódot képes összevessünk száz patakok (stream 512) hatékonyságának növelése végrehajtását pixel shader.
Miután áthaladt az elosztó processzor áramlások jönnek képpontbíokkokra (Quad Pixel Shader magok). Minden ilyen egység (GPU csak négyen) négy pixel processzorok össze, amelyek mindegyike képes feldolgozni shader számára 2x2 blokk pixel per óra. Ennek megfelelően a képpontbiokkra képes feldolgozni shader 4x4 blokk pixel per órát.
Magától értetődik, hogy a „futószalag” ebben az építészet, valamint a „pixel csővezeték” elvesztette értelmét.
Ugyanakkor, annak ellenére, hogy a helytelen használata a „szám szállítószalag” az építészet grafikus processzor család ATI Radeon X1000, meg kell jegyezni, hogy az eljárás építésekor szállítószalag kép, alkalmazás-specifikus vertex és pixel processzorok változatlan maradt. Bár a probléma az optimális teherelosztás között az egyes blokkok a GPU architektúra processzor ATI Radeon X1000 megoldható (bár nem drámai), ez az architektúra nem teszi lehetővé, hogy megszabaduljon a hiányzó másik szállítószalag GPU architektúra. Gyakran van olyan helyzet, amikor már részben feldolgozott adatok változhatnak. Ehhez meg kell várni a befejezése az egész folyamat adatok továbbítására, ahol a csővezeték eldobjuk, adatfeldolgozás, hogy továbbra is szükség van szerkeszteni és újra feldolgozásra.
Hátrányai adatok továbbítására a GPU is megoldható lesz az építészet egységes processzorok, hogy van, amikor nincs egyetlen csúcs vagy pixel processzorok, és vannak általános célú processzorok, amely képes elvégezni mindkét vertex és pixel shader. Természetesen az egységes feldolgozók szükség új feldolgozó programok, vagyis shader (Shader Model, SM). Egységes processzorok támogatják a DirectX 10 API-t.