Képgyártás

Hogyan lehet felhívni a címkéket, amelyek ellenállnak az elismerésnek? Ennek a kérdésnek a megválaszolásához egy másik kérdésre kell válaszolni - az elszámolási algoritmusok alapelveire. Akkor meg fogjuk érteni, hogy ez a felismerés a lehető legegyszerűbb.

A közhiedelemmel ellentétben, hogy megkerülje CAPTCHA, mint általában, nem használható univerzális beolvasott szöveget elismerést programok, mint a FineReader vagy MS Office Document Imaging, így ha a CAPTCHA nem alkalmas arra, hogy ismerjék ezeket a programokat, ez nem jelenti azt, hogy a címke nem lehet könnyen felismerhető kihegyezett meg alatta egy személyes azonosító (lásd a Hackelés példákat).

Az elismerés két fő szakaszra tagolódik:

  • Határozza meg az egyes szimbólumok helyét és határait.
  • A tényleges karakterfelismerés.

Ha a szimbólumok mindig ugyanazon a helyen vannak (mint például az Invision Power Board fórumán - lásd a jobb oldali ábrát), csak a második marad ez a két szakasz. Ezért minimális a szimbólumok koordinátáinak módosítása.

Ha a szimbólumok helyét nem rögzítik, a következő kiválasztási mód az összehasonlítás a háttérben. Ha a karakterek színe eltér a háttérszíntől (mint a phpBB fórumban), ez nem nyújt védelmet:

Balra csak sötét pixelek - és "voila".
Sárga kiemelt kimutatott ismeretség (négyszögek, amelyek maguk "sötét pixeleket" tartalmaznak)

Így például olyan zajt kell hozzáadni, amelyet nehéz elkülöníteni önmagától a szimbólumtól, vagy megnehezíti a szimbólumok szétválasztását azáltal, hogy visszaadja vagy átfedi egymást.

Valójában a karakterfelismerés sokféle módon történhet.

A legegyszerűbb módja a "maszkolás". A programnak van egy hivatkozási betűtípusa, minden egyes karakterrel összehasonlítja az elismert betűtípust. Ez a szimbólum, amely a legjobban illeszkedik (az azonos színű képpontok a szabványban), és a válasz.

A CAPTCHA összehasonlítható a maszkkal, nem használva a szimbólumok geometriai torzulását, és egy betűtípussal (vagy nagyon korlátozott számmal).

Más, bonyolultabb algoritmusok a szimbólumot karakterisztikus jellemzőkkel ismerik fel: az ágak számát, zárt területeket, kölcsönös elrendezésüket. Van egy osztály algoritmusok az úgynevezett „neurális hálózatok” - van, durván szólva, egy fekete doboz, amely az első képzési és így a kép a helyes választ, majd az edzés után, akkor képes lesz arra, hogy a helyes választ magának. Igaz, a tanulási folyamat nagyon hosszú és fáradságos.

Az ilyen algoritmusok elleni védelemhez hozzáadhat olyan zajt, amely jelentősen torzítja a szimbólumok rajzát, de fennáll a veszélye a túlzásnak és a képnek, amelyet egy személy nem ismeri fel.

Úgy vélem, hogy a legnagyobb figyelmet kell fordítani az első védelmi pontra - a szimbólum határainak azonosításától -, nehéz felismerni a szimbólumot, ha nem tudjuk, hol kezdődik és végződik.

Tekintse meg ezeknek az elveknek az alkalmazását a valós CAPTCHA példáihoz (a név csillagai megmutatják személyes biztonsági minősítésem - 1-4-et):

Google ***
A felirat nemlineáris torzulása, a szimbólumok elmozdulása egymáshoz képest, a szimbólumok közelsége, különböző betűtípusok.
Zajeket nem alkalmaznak. Igaz, a szimbólumok nem mindig ragadnak össze rések nélkül.

MSN ****
A szimbólumok elforgatása és torzítása, az azonos színű vonalak formájában zaj, zajcsökkentő szimbólumok.

Yahoo ***
A szimbólumok nemlineáris torzulása, a zaj törött vonallánc formájában.
A hátrányoktól - a szétválasztott vonal elválasztható a szimbólumtól.

Mail.ru nagyon régi **
Karakterek forgatása, kis betűs változatok, alacsony kontraszt a háttérrel. Véleményem szerint - nem egy nagyon jó CAPTCHA (a szimbólumok általában sötétebbek, mint a zaj, külön találhatók meg)

Mail.ru old ****
Magasság eltolás, szimbólumok nemlineáris torzítása, poligon egymásba kerülésével azonos színű jelek formájában.

Yandex ****
Kontúr szimbólumok rögzítése, nemlineáris torzítás, zaj a fehér és a sötét vonalak formájában.

Rambler régi **
Többszínű szimbólumok, forgatás, eltolás. A zaj pontok és egyenes vonalak formájában.


Rambler ***
Szimbólumok nemlineáris torzítása. A szimbólumok azonban könnyen elválaszthatók egymástól és a zajoktól. Ez csak a szimbólumok felismerése, és még nehezebb még neurális hálózatok bevonása nélkül is (mivel a karakterek számjegyek, és főként vízszintesen eltorzulnak).

Beeline ***
A karakterek kis méretű lineáris torzulása, különböző méretűek. A szimbólumokat háttérbe helyezték a zajt a geometriai ábrák (ellipszisek) formájában inverzióval. Hátrány: a számok sokkal kontrasztosabbak, mint a háttér.

MTS régi **
Egy kis csavar, a szimbólumok eltolódása. Alkalmanként csúfognak egymáson. A zaj könnyen eltávolítható az élesség (elmosódás) csökkentésével. Elég gyenge CAPTCHA

MTS új ***
Egy kis csavar, a szimbólumok eltolódása. Alkalmanként csúfognak egymáson. Betűtípusok. Jelentős zaj, mind háttérképek formájában, mind vonalak átfedő szimbólumok formájában. Igaz, hogy néha még egy személy sem tudja mindig könnyen olvasni az eredményt.

Megaphone ***
Szimbólumok váltása, zaj a vonalak és pontok formájában.
A párhuzamos vonalak kiszűrhetők, a ferde vonalak nehezebbek.

# 10097; Webhelytervezés, csak design elrendezés nélkül, PSD elrendezés - 5-től 10-ig.
Portfólió és munkák példái. Tervező: [email protected] Skype: tanditl Love (Teolinka)

Kapcsolódó cikkek