Hol használható CUDA számítógépes erőforrás sm

Bár a kilátások GPU számítási óriási erők, a legnépszerűbb megoldás - Nvidia CUDA ingyen, van egy csomó dokumentáció és az egész nagyon egyszerűen megvalósítható, alkalmazások használják ezt a technológiát nem annyira. Alapvetően ez mindenféle speciális számítások, amelyek az egyszerű felhasználó a legtöbb esetben nem ez a helyzet. De vannak még tervezett programok mainstream felhasználók, róluk fogunk beszélni ebben a cikkben.

Először is, egy kicsit a technológiát, és hogyan kell kezelni azt. mert Amikor írom ezt a cikket én vezérelte az olvasók széles köre, majd próbálja megmagyarázni, hogy érthető nyelven nélkül összetett kifejezéseket és kissé rövid.

Bejövő adatfolyamokat külön kezeli, azaz a párhuzamosan.

Hol használható CUDA számítógépes erőforrás sm

Tehát van egy felosztás három szintje van:

Hol használható CUDA számítógépes erőforrás sm

Rács - a kernel. Ez tartalmaz egy / két / három-dimenziós tömb blokkok.

Blokk - tartalmaz több csavarmenettel (menet). Streams különböző egységek kölcsönhatásban vannak egymással nem. Ezért volt szükséges bevezetni a blokkok? Minden blokk lényegében felelős a részfeladatok. Például, egy nagy képet (amely egy mátrix) lehet osztani több kisebb részre (mátrixok), és párhuzamosan fut minden része a kép.

Menet - szál. Streams egyetlen egységen belül vagy kölcsönhatásba léphet egy közös (megosztott) memória, amely egyébként sokkal gyorsabb, mint a globális (világ) memória, vagy olyan eszközök révén szinkronizálására patakok.

Warp - társulás kölcsönhatásba patakok minden modern GPU Warp'a mérete 32 Következő egy félig vetemedik. Ez a fele warp'a, mivel memória-hozzáférés általában külön-külön az első és a második felében warp'a.

Mint látható, az építészet nagy párhuzamosítás feladatokat. Bár a programozás végezzük C bizonyos korlátozásokkal, de a valóságban nem olyan egyszerű, mert nem minden lehet párhuzamosított. Nem ugyanaz a szabványos funkciók véletlen szám generálás (vagy inicializálási), mindezt elkülönítve kell vezetni. Bár kész lehetőségek állnak rendelkezésre elegendő mennyiségben, az öröm az egész nem működik. Az a képesség, hogy használja a rekurzió meg a közelmúltban.

Az egyértelműség kedvéért ez volt írva egy kis konzol (minimalizálása kód) programot, amely a művelet két float típusú tömb, azaz a nem-egész értékek. A fenti okok miatt, az inicializálás (kitölteni egy sor különböző tetszőleges értékek) előállított CPU erők. Ezután, a megfelelő elemek az egyes tömb előállított 25 fajta műveleteket, közbenső eredményeket feljegyeztük a harmadik tömb. Megváltozott a méret a tömb, az alábbi eredményeket:

Mind a 4 vizsgálatokat végeztük:

1024 db minden tömb:

Hol használható CUDA számítógépes erőforrás sm

Világosan látható, hogy egy ilyen kis elemszám a párhuzamos számítási legkevesebbet A számítások maguk sokkal gyorsabb, mint a képzés.

4096 elemek az egyes tömb:

Hol használható CUDA számítógépes erőforrás sm

Most 12.288 db minden tömb:

Hol használható CUDA számítógépes erőforrás sm

És az utolsó teszt - 36864 db minden tömb:

Hol használható CUDA számítógépes erőforrás sm

Egyébként, látható, hogy a folyamat a számítások elvégzése megnövekedett terhelést a GPU, valamint a memória kiosztás esetén.

Hol használható CUDA számítógépes erőforrás sm

      * A sorozat "Lie to me" - 1280x720, MPEG4, H.264.
      * A sorozat „Felhőtlen Philadelphia” - 624h464, xvid.

A tartály és a mérete az első két fájl .mkv és 1,55 gigabájt, és az utolsó - .avi és 272 mb.

Kezdjük egy nagyon szenzációs és népszerű termék - Badaboom. Régebben - 1.2.1.74. A program ára $ 29.90.

Hol használható CUDA számítógépes erőforrás sm

A program felülete egyszerű és egyértelmű -, hogy a bal oldalon, válassza ki a forrás fájlt vagy a lemez, és a jobb oldalon - a szükséges eszközt, melyek kódolnak. Vannak még felhasználói módban, amelyben a paraméterek beállítása kézzel, és azt használják.

Hol használható CUDA számítógépes erőforrás sm

Hol használható CUDA számítógépes erőforrás sm

Hol használható CUDA számítógépes erőforrás sm

Most már könnyen érthető, miért igényelnek támogatást érintőképernyők és a multi-touch technológia. Sőt, a program egy többfeladatos, furcsán hangzik. Hogyan? Nézze meg a videót:


A kódolás a processzor kihasználtsága 100%, de ez nem okoz kellemetlenséget. A böngésző és egyéb non-heavy alkalmazások nem lassul.

Hol használható CUDA számítógépes erőforrás sm

Az eredmények sokkal jobbak, mint Badaboom. Minősége, valamint a magasság különbség az eredeti látható csak páronkénti összehasonlításával szalag nagyító alatt.

Ezután lépjen átkódolás le felbontás és bitráta:

Hol használható CUDA számítógépes erőforrás sm

Hol használható CUDA számítógépes erőforrás sm