Áttekintés az online szolgáltatások optikai karakterfelismerő
Vannak megbízható és kiváló minőségű OCR-rendszerek állnak rendelkezésre az interneten?
Szerkesztéséhez nyert információk egy szkenner, meg kell alkalmazni a technológiát, amely a nevét a OCR hogy a megfejtése és fordítására orosz úton „optikai karakterfelismerő”. Kíváncsiak voltunk, hogy a megbízható és magas színvonalú OCR-rendszerben van elérhető online?
Ugyanebben OCR, sajnos, nem forradalom történt az elmúlt öt évben, bár néhány változtatást tett fel. Például az érezhetően eltolódott az egyensúlyt az asztali rendszerek elismerés a web szolgáltatásokat. Azt nem mondhatjuk, hogy az OCR-piaci belépett, de a változás fogalmának számítógép segítségével, terjedése a mobil technológia, az internet „felhő” szolgáltatás - mindez azt diktálja, egy olyan helyzetben, ahol a felhasználó szembesülnek azzal a ténnyel, hogy az asztali számítógép nem kéznél.
De vészhelyzet esetén, akkor a kép, és próbálja „etetni” a képet az egyik OCR-line szolgáltatásokat. A legvalószínűbb, idővel ez az út lesz egyre népszerűbb, ezért úgy döntöttünk, hogy menjen a tanulmány online felületek a keresést egy jó szolgáltatás elismerése beolvasott szöveget.
Nem tűztük ki magunk elé a feladat megtalálni természetesen ingyenes szolgáltatás, ami arra utal, hogy ezek egyszerűen nem lehet. Azonban a non-profit források az ilyen típusú még találtak. Van is egy shareware, akkor képes felismerni néhány oldalt „a tárgyalás.” Mindenesetre, a szolgáltatásnak támogatnia kell az orosz nyelv, és nem igényel telepítést a számítógépen: néha egyszerűen lehetetlen szolgáltatás gépek.
Mivel az utolsó fájl rossz volt, mint a felbontás, tisztaság és geometriáját a kép, de a legközelebb a területen. A képek a szokásos oldalak a könyv, az üzleti jelentés és el kell különíteni a szöveget, és még egy egyszerű táblázatot. Ez ezzel a nagyon reális adathalmazt kellett értenie az alanyok.
Az elsőt elején Google azok dokumentumok (docs.google.com). Nem mindenki tudja, hogy amellett, hogy együtt dolgoznak az anyagi szolgáltatás lehetővé teszi, hogy felismerje a betöltött dokumentum formájában egy képet vagy PDF formátumban. Nincsenek különleges intézkedés nem szükséges, hogy minden kapott automatikusan. Azonban a fájl mérete legfeljebb 2 MB, így nem tudott küldeni teljes vizsgálat egy könyv oldalait. Méretének csökkentése, tudtuk, hogy „húzza” szerkeszthető szöveget.
„Documents Google» könnyű felismerni a fordítottja az oldalt, és foglalkozik a szöveget. A munka minősége nem tudja értékelni magasabb 4 pont az 5, mert senki bekezdés nem történik hiba nélkül. Azonban ez még mindig egy nagyságrenddel gyorsabb és egyszerűbb, mint a gépelés tiszta lappal.
Komplex forrás fájlok dolgok rosszabbra: a felismerési minőséget esett „három” skálán nem megy ki a felismerése bonyolult formázás és táblázatok. Mindazonáltal kielégítő eredményt feljegyeztük, és az erőforrás is érdemes elfogadják, mint egy hatékony módja annak, hogy a szöveget a PDF vagy kép.
Azt viszont, hogy egyértelmű kedvence a teszt. Abbyy cég pár évvel azt javasolja, hogy minden erejét annak OCR-mechanizmus révén egy webes szolgáltatás (finereader.abbyyonline.com). Ellentétben az asztali változat, természetesen rendelkezésre áll. Először is - a támogatott nyelvek száma ( „csak” 49 ellen közel 200 szakmai FineReader változat), valamint hiányában további funkciók feldolgozásra szöveg felismerése után.
Beviteli formákat lehet gyakorlatilag bármilyen népszerű képformátum vagy PDF jelszó nélkül, és a kimeneti - DOC, XLS, ODT, TXT és PDF. Tölthet be dokumentumokat akár 30 MB.
A használata csoda szolgáltatás azonban meg kell fizetni. Képes beolvasni által vásárolt oldalt, majd 100 p. Lesz kiguberál $ 7. Azonban a minőség megéri - tiszta 5 out of 5!
A következő lépés a külföldi szolgáltató és ellenőrizze, hogyan birkózik meg az orosz nyelvet. OCRonline (www.ocronline.com) együttműködik a 14 legnépszerűbb európai nyelven. A szolgáltatást nem ingyenes, de előzetes regisztrációhoz töltött öt szabad „teszt” oldal, és ezen kívül, minden hétfőn az egyensúlyt feltöltik ingyenesen leginkább öt oldalt. További csomagok is lehet vásárolni olyan alacsony, mint 8 $ 100 p. És olcsóbb, ha a megrendelést ömlesztve.
A nagyon elismerésének folyamatában nem sok észrevehető. A kilépés az Ön rendelkezésére lesz a szöveg DOC, TXT, PDF vagy RTF. De az eredmények érdekesek voltak. Minőségű képeket a kamera, és egy szkenner nagyfelbontású ismerték tökéletesen, sőt anélkül, hogy egyetlen hiba. Solid öt! A képet az alacsony minőségű szolgáltatás is megbirkózott a bumm, még az asztal nem szűnt meg sehol! De a foltokban elég, olyan nagy az a felismerés nem nevezhető. De 5-ből 4 - ez egy nagyon jó jel. Mindenképpen érdemes ezt az erőforrást, hogy vizsgálja felül a sürgős problémákat.
A minták azt mutatták, hogy a szolgáltatás nagyon érzékeny a minősége az eredeti. A képet a szkenner teljes felbontású tette számunkra, hogy egy nagyon jó szöveg, szinte hiba nélkül. De a munka bonyolult forráskód nem sikerült. Szöveg minősége gyenge, és helyes gépelési hibákat, akkor sokkal nehezebb, mint beírni a szöveget magát.
Azt kell mondani, a győzelem nem történt meg. Figyelmen kívül hagyja a tudatosan egyszerű design a helyén, mert nem jön ide ez. A maximális feltöltési fájl mérete 2 MB - elég. Let támogatja az alapvető formátumok (PDF de felismerte, csak az első oldalon), és egészen lenyűgöző nyelven, de a kimenet csak szöveget formázás nélkül. Emellett betölteni minden fájl meg kell adnia betűk CAPTCHA.
Rendelkezésre álló szabad határ 5 MB letölthető képeket naponta. Ha több kell, akkor hozzáférést biztosít a nap segítségével egy fizetett SMS-ben a bejelentett ár körülbelül 20 rubelt.
Erőforrás New OCR (www.newocr.com) ígér teljesen ingyenesen használható OCR-technológia a szkennelt dokumentumokat. És azt kell mondanom, jó funkcionalitás - a lehetőségek ez a szolgáltatás nagyon jó. Bíró magadnak: 58 nyelven, két különböző OCR-algoritmus közül választhatunk, korlátlan letöltés regisztráció nélkül és díjmentesen, az összes népszerű formátumot, beleértve a többoldalas dokumentumok, és még letölthető archivált fájlok (!).
És mi a helyzet a minőségi OCR közvetlenül? A minőségi alapanyagok új OCR jól viseli. Hiba minimális, és csak némi zavart formázási teszi fel mínusz egy jól megérdemelt öt. Meg lehet próbálni, hogy javítsa az eredmény, a választás a két észlelési mechanizmusok.
Hogy teljes legyen a kép bemutatunk egy másik helyszínen. Semmi sverhvydayuschegosya ő nem ígér, de ez szabad, és egy szép felület, akkor nézd meg magad nézi www.sciweavers.org/free-online-ocr. Támogatja 33 nyelven és az összes népszerű képformátumok a forrás fájlt. minőségének elismerése nem nevezhető kiemelkedő, de jó fotó szöveget meghatározott minimális hibák és igényel szinte semmilyen beállítás. A rossz kép baj, és a kapott sor karakter nincs értelme. De ez ingyenes - itt az ideje, és mellékelni kell egy egész köteg más hasznos szolgáltatásokat megoldására mindennapi problémák átalakítására digitális adatok - ez kettő.
Egy összefoglaló „olvasás”
Megismerése után az összes ilyen rendszerek, levonhatjuk bizonyos következtetéseket. Először is - és ez jó hír! - online szolgáltatások szövegfelismerő ott, és jól működik. Sokan vannak még szabad, ami igaz, kellemes meglepetés volt.
Egyes szolgáltatások azonban megbirkózott a „nehéz” eseteket, így a bizalom rakjuk a felülvizsgálati vezetők. Mindenekelőtt az online per FineReader. A szabad online felismerők jobb, mint maga mutatta, New OCR. Ezért e két szolgáltatás is elnyerte a jelvényt «Hard'n'Soft ajánlja.”
Felismerni és lefordítani!
gyakran előfordul a mai nyitott világban, hogy sürgősen szükség van, hogy megértsük, mit mondanak a papír vagy a PDF-dokumentumot. A probléma az, hogy lehet, hogy ez egy idegen nyelvet. Tehát, egy pár OCR-erőforrás találni egy online fordító.
Mi tekinthető a felülvizsgálat szabad website után azonnal New OCR felismerés kínál küldeni a dokumentumot Google Translate (translate.google.com). Ez az egyik legismertebb online fordító, amely működik tucat nyelvpárokat ugyanakkor van egy egyszerű felületen, és szigorúan korlátozza a hossza a lefordított szöveget, úgy, hogy a beolvasott dokumentum lesz képes olvasni azonnal.
Automatikus fordítását nem várhatunk csodákat szempontjából tökéletes, de a Google Translate fordítás minősége jónak tekinthető, és általában azt használják az oldalt az első helyen.
Egy alternatív megoldás - egy online szolgáltatás www.trans-late.ru hazai PROMT. De van egy határ 3000. Szinkrontolmács szimbólumok. Ahhoz, hogy a könyveket kellett fordulni lefordítani két lépésben.
Ezekkel és más online fordítási szolgáltatás után az optikai karakterfelismerés, a probléma a médiumok tartalmi anyagot egy nyelv kéne semmivé. A másik lenne, hogy összekapcsolják a legjobb eredményeket, de ugyanazon a felületen, így ingyen.