Hol használható CUDA számítógépes erőforrás sm
Bár a kilátások GPU számítási óriási erők, a legnépszerűbb megoldás - Nvidia CUDA ingyen, van egy csomó dokumentáció és az egész nagyon egyszerűen megvalósítható, alkalmazások használják ezt a technológiát nem annyira. Alapvetően ez mindenféle speciális számítások, amelyek az egyszerű felhasználó a legtöbb esetben nem ez a helyzet. De vannak még tervezett programok mainstream felhasználók, róluk fogunk beszélni ebben a cikkben.
Először is, egy kicsit a technológiát, és hogyan kell kezelni azt. mert Amikor írom ezt a cikket én vezérelte az olvasók széles köre, majd próbálja megmagyarázni, hogy érthető nyelven nélkül összetett kifejezéseket és kissé rövid.
Bejövő adatfolyamokat külön kezeli, azaz a párhuzamosan.
Tehát van egy felosztás három szintje van:
Rács - a kernel. Ez tartalmaz egy / két / három-dimenziós tömb blokkok.
Blokk - tartalmaz több csavarmenettel (menet). Streams különböző egységek kölcsönhatásban vannak egymással nem. Ezért volt szükséges bevezetni a blokkok? Minden blokk lényegében felelős a részfeladatok. Például, egy nagy képet (amely egy mátrix) lehet osztani több kisebb részre (mátrixok), és párhuzamosan fut minden része a kép.
Menet - szál. Streams egyetlen egységen belül vagy kölcsönhatásba léphet egy közös (megosztott) memória, amely egyébként sokkal gyorsabb, mint a globális (világ) memória, vagy olyan eszközök révén szinkronizálására patakok.
Warp - társulás kölcsönhatásba patakok minden modern GPU Warp'a mérete 32 Következő egy félig vetemedik. Ez a fele warp'a, mivel memória-hozzáférés általában külön-külön az első és a második felében warp'a.
Mint látható, az építészet nagy párhuzamosítás feladatokat. Bár a programozás végezzük C bizonyos korlátozásokkal, de a valóságban nem olyan egyszerű, mert nem minden lehet párhuzamosított. Nem ugyanaz a szabványos funkciók véletlen szám generálás (vagy inicializálási), mindezt elkülönítve kell vezetni. Bár kész lehetőségek állnak rendelkezésre elegendő mennyiségben, az öröm az egész nem működik. Az a képesség, hogy használja a rekurzió meg a közelmúltban.
Az egyértelműség kedvéért ez volt írva egy kis konzol (minimalizálása kód) programot, amely a művelet két float típusú tömb, azaz a nem-egész értékek. A fenti okok miatt, az inicializálás (kitölteni egy sor különböző tetszőleges értékek) előállított CPU erők. Ezután, a megfelelő elemek az egyes tömb előállított 25 fajta műveleteket, közbenső eredményeket feljegyeztük a harmadik tömb. Megváltozott a méret a tömb, az alábbi eredményeket:
Mind a 4 vizsgálatokat végeztük:
1024 db minden tömb:
Világosan látható, hogy egy ilyen kis elemszám a párhuzamos számítási legkevesebbet A számítások maguk sokkal gyorsabb, mint a képzés.
4096 elemek az egyes tömb:
Most 12.288 db minden tömb:
És az utolsó teszt - 36864 db minden tömb:
Egyébként, látható, hogy a folyamat a számítások elvégzése megnövekedett terhelést a GPU, valamint a memória kiosztás esetén.
-
* A sorozat "Lie to me" - 1280x720, MPEG4, H.264.
-
* A sorozat „Felhőtlen Philadelphia” - 624h464, xvid.
A tartály és a mérete az első két fájl .mkv és 1,55 gigabájt, és az utolsó - .avi és 272 mb.
Kezdjük egy nagyon szenzációs és népszerű termék - Badaboom. Régebben - 1.2.1.74. A program ára $ 29.90.
A program felülete egyszerű és egyértelmű -, hogy a bal oldalon, válassza ki a forrás fájlt vagy a lemez, és a jobb oldalon - a szükséges eszközt, melyek kódolnak. Vannak még felhasználói módban, amelyben a paraméterek beállítása kézzel, és azt használják.
Most már könnyen érthető, miért igényelnek támogatást érintőképernyők és a multi-touch technológia. Sőt, a program egy többfeladatos, furcsán hangzik. Hogyan? Nézze meg a videót:
A kódolás a processzor kihasználtsága 100%, de ez nem okoz kellemetlenséget. A böngésző és egyéb non-heavy alkalmazások nem lassul.
Az eredmények sokkal jobbak, mint Badaboom. Minősége, valamint a magasság különbség az eredeti látható csak páronkénti összehasonlításával szalag nagyító alatt.
Ezután lépjen átkódolás le felbontás és bitráta: