Automatikus képigazítás
Automatikus képigazítás
Azok számára, akik beolvassák vagy feldolgozzák a beolvasást, nem titok, hogy a beolvasott kép egyeztetése meglehetősen kellemetlen eljárás (ha kézzel történik). Számos módszer létezik (algoritmusok) az automatikus igazításhoz. Mindkét módszer alapja - vonalak keresése a képen, eltérően ezekből a sorokból a vízszintes / függőleges, akkor meg tudja ítélni, hogyan lehet forgatni a képet. A legrosszabb lehetőségek közé szorítva, és szükség esetén a képet elforgatják.
Először Khuf algoritmust használtam. ami jól ismert az interneten, és elvben jó eredményeket ad. De - csak képeket tartalmazó képeken. És van egy feladatom - a képek és szövegek összehangolása. (Csináltam a szabadidődben szkennelés és helyreállítása szovjet könyveket. És ez az átalakítás így meglepően érzékeli vonal és kiszámítja a dőlésszög, úgy döntött, hogy megtalálja, honnan láb nő, és megpróbálják újraírni azt a Java. Sources vannak. Tehát zavaros kód és a C ++ -re optimalizálták, hogy a fordítás a 2. nap körül valahol elkezdődött. Ebből kiderült,
Az algoritmus gyorsan működik az ördög számára, mivel a bájt minden lehetséges változatának térképét a bájtban tárolja, vagyis 8 pontot számolnak egyszerre egy iterációra. De hogyan működik és mi történik belülről, nekem egy rejtély :) A legfontosabb dolog, ami működik.
Nem hiszem el a szemem. Véletlenek vannak.
Két nappal ezelőtt befejeztem ugyanazt a kódot a Java-hoz. És a folyamat, egyébként pár napig is eltartott. Alapvetően az algoritmus lényegének félreértése miatt. Az elmélet olvasásának kísérlete csak végül zavart volt. De mintha minden úgy működött, ahogy kellene.
Most itt gondolom, hogyan lehet megoldani a kérdést autocrop. Keresek már olyanokat, akik már dolgoztak a hálózatban - és most befutottam a bejegyzésedbe.
Autocrop segítségével egy kicsit eltarthat az ImageMagic-tól - van egy trim opció, amely egyszerűen kivágja a legmagasabb sűrűségű területet.
Én is gondoltam autocrop, de van egy másik sajátosság - én kivágott scans - vannak a szélei a byak és a maradék vonalak tisztítás után a háttérben. Amikor írok, elküldöm.
By the way, miért konvertálod a DJVU-t PDF formátumba? Az első formátum jobb a beolvasott könyvek számára. A PDF-ben a dokkok többet kapnak, és a minőség nem nagyon - a felbontás csökken.
> By the way, miért kellene a DJVU PDF formátumba konvertálni? Az első formátum is jobb a beolvasott könyvek számára. PDF-ben a dokkok> többet kapnak és a minőség nem nagyon - a felbontás csökken.
> Én is gondolkodtam az autocropon, de van egy másik sajátosságom - kivágom a beolvasásokat - a takarítás után a byak és a maradék vonalak élei vannak. Amikor írok, elküldöm.
Számomra a feladat kijelentése ideális: pontosan ugyanazt a kezeletlen piszkos vizsgálatokat, de csak a djvu-ban lezárják.
A héten távozok, vissza fogok térni - a kérdéssel sokkal sűrűbben fogok foglalkozni (ha nincs a fő munkahelyi törmelék). Néhány ötlet megjelenik - megosztom.
Egyébként, ha érdekes, még egy probléma a betűtípus elhalványult színe. Már szinte határozott. A probléma az, hogy szeretnék ezt automatikusan, és nem lehet egyszerűen egy bizonyos színt (font color), hogy a fekete, mert úgy találta, más helyeken - például egy könyv színes képekkel, vagy a háttérben a szöveget a képen van. Én ezt teszem - a könyvben egy oldal van kiválasztva, ahol van kép és szöveg. Ezután kiválaszthatunk egy olyan területet, ahol csak szöveg található. Határozza meg az oldalon található objektumokat. Azokat a tárgyakat, amelyek a szöveges területen a "Szöveg" címkét rendelik hozzá, a többit a "Kép" -hez. Az egyes csoportokhoz legközelebb álló objektumokat összekötjük például 3-4-szer, és rögzítjük az objektumok kapcsolatát és méretét a jellemzők sorában. Ezután az önszerveződő térképek mindegyiket adják nekik - edzünk. Végül nagyon jó minőségű felismerőt kapsz, hogy van szöveg, és ez nem így van. Megpróbáltam egy gyerek könyvét, a 100% -os találgatás eredményeit az oldalon, amit tanulmányoztam. Most meg kell erősíteni a más oldalakon való kipróbálást. Ha mindez kiderül, írok egy újabb rövid cikket arról, hogyan kell csinálni. Az egyetlen ajánlat, ez az, hogy az algoritmusnak először meg kell mutatnia a területet a szöveggel - a vonat. De az interneten nem találtam semmi jobbat.
Többé-kevésbé elfogadható algoritmust készítettem a mezők kivágásához. Természetesen sok tekintetben az én tesztdokumentumomhoz illik, és nem úgy, mint az egyetemesség. De mindent egy sorban vizsgálok - főként csak fedőlapokon és gazdagon illusztrált oldalakon (nem tudom felismerni, hogy hol van a szennyeződés, és a kép elkezdődik, vagy a kép élei a kötés árnyékaként vehetnek részt). Azt hiszem, egy új verziót kaptam egy hétig.
Nagyon érdekes a munkálatok az oldalak fehérítésével - a levelek megzsarolása számomra. Most csak fehér vagy fekete színt töltek be minden olyan pixellel, amely nem esik bizonyos határokon. Ennek eredményeként - lyukak és szakadt a szélén a betűk.
Ez az, amit autocrop-ról ások.
A srácok jó módszert kínálnak. A megvalósítás a szempillákra bámulhat.