Ivan Ivanovich Kuznetsov, milyen gyorsan átkutat egy könyvet pdf formátumban (clearscan segítségével),
Ebben a rövid bemutatóban szeretnék megosztani gondolataimat a könyvek gyors beolvasásáról PDF formátumban, valamint a ClearScan technológiának az Adobe Acrobat 9.0 verzió óta elérhető megjelenéseiről. Véleményem szerint ez egy csodálatos technológia, így (végül!) A PDF formátum alkalmas a beolvasott szövegre.
Valójában, amikor pusztító szkennelés (könyv szakadt lapok és használt lemez szkenner), a szkennelési folyamat - takarítás - transzferek PDF - OCR lehet végezni három órával az átlagos mérete a könyv. (Azt kell mondanom, hogy nincs tapasztalata fotózás könyvek, látszólag fényképezett is gyorsan elvégezhető, a megfelelő felszerelés, és így elkerülhető a pusztítás a papír könyvet.) Ha „üveges”, vagyis van elég türelme olvasni a könyvet a lapolvasó üvegre , a beolvasás nyilvánvalóan tovább fog tartani.
Hogyan keresi a kezdő
Hogyan keresi a kezdő
Ha van egy szkenner, akkor be akarsz szkennelni valamit! És hála Istennek. Nézd meg a digitális könyvtárak bőségét. Köszönet mindazoknak, akik szkennelték, és kiküldték másoknak.
És ez néha igaz. Rengeteg különböző papír van (1, 2 ... 10 lap), amellyel én így teszek. Miért zavarja őket? Látható - lesz. És többet nem szükséges. De itt van a könyv ... és még azok számára is, akik szeretik a könyveket ... Lehetséges, hogy a kapott, ferde szemetet csíkkal, foltokkal, fekete pontokkal hívják fel egy szakadt könyvvel? Hol van eltemetve a kutya? Milyen opciót kell beállítani, melyik karral csavarjon, így minden úgy néz ki, mint az eredeti?
Az a tény, hogy nincs ilyen egyetlen kar. Van egy négylépcsős folyamat, amelynek minden lépése a kezelőtől néhány optimális megoldást igényel. Egy olyan programcsomag egy olyan szkennerhez, amely úgy működik, mint egy "egy-shot all pobivahom", elrejti ezt a négylépcsős folyamatot, így egy művelet: egy papírlap - elektronikus egyenértékű. De ami igazán történik, valami bonyolult, még mindig találgathat. Például a lapolvasó már befejezte a szkennelést, és a számítógép nem áll készen a folytatásra; rajta néhány program nyitva és lezárva; villogó merevlemez-hozzáférés lámpa ...
A könyvet minőségi vizsgálat céljából át kell végezni a folyamat lépésein: beolvasás, tisztítás, a kívánt formátumba való konvertálás és az OCR.
Ennek a szakasznak a feladata a könyv papír oldalainak lefordítása a hozzájuk tartozó TIFF-fájlokba, 300 dpi felbontással. Ez az engedély elegendő a szokásos ("olvasható") méretű könyvek szövegéhez. Egy kis betűtípussal vagy vágyakozással az illusztrációk kis részleteinek átadására több felbontás szükséges. Átverés a lapolvasó beállításain keresztül. A kimeneten grafikus fájlokat kell letölteni TIFF formátumban. Egy lap egy fájl. És nincs többoldalas TIFF (ha több oldal van egy TIFF-fájlban)! Nincsenek PDF-fájlok! Nincs szövegfelismerés (szövegfelismerés)!
Ebben a szakaszban el kell döntenie, hogy beolvassa-e a könyvet színes vagy szürkeárnyalatosan. Általában nem ajánlott a szkennelést szigorúan fekete-fehér változatban (bw) vizsgálni, mivel a szkennernek el kell döntenie, hogy mit kell tenni a fekete és a fehér színnel. Mondjuk, az oldalon lévő hajlítás átkerülhet a fekete színre, és fekete sávokat és foltokat hozhat létre, és még rosszabb, ezek a foltok bezárják a fekete szöveget. Az ilyen "fekete-fekete" tisztítás után lehetetlen. Ha a fényes folt (sáv, egy másik hiba) szürke (vagy más, színes szkennelés) színes és fekete szöveget (nem hiba) színes, a hiba lehet eltávolítani a lépést tisztítás törlésével képfoltos színű. Az is előfordul, hogy a szigorúan fekete-fehér szkennelés vékonyítja ki és törli a vonalakat és betűtípust (azaz amikor a levél azt mondja, hogy a "d" úgy néz ki, mint a "cl"). Ezért minőségi vizsgálat céljából képzeld el, hogy a (bw) opció nem létezik.
A lapolvasó számára a letapogatás a fedél vágásával kezdődik. Egy rendes konyhai kés egy rövid pengével és egy kényelmes fogantyú nagyon alkalmas. Puha fedél esetén a kést a fedél és az első oldal (a fedél lezárva) és a fedél levágása között nyomja meg. Ha a könyv kemény burkolattal van ellátva, akkor a fedél nyitva van, maga a könyvet levágja. Ezután az oldalak egyenként jönnek el, vagy levágódnak. A rongyos éleket a program segítségével a tisztítási szakaszban eltávolíthatjuk. A legfontosabb dolog az, hogy a rongyos élek nem mászik a szöveget.
Írok ezeket a sorokat, és a fejemben hangzik Marshak költeménye:
A Skvortsov Grishka-nál Egyszer volt könyv - piszkos, piszkos, rongyos, kopott ...
Nekem van könyvem, gyermekkoromból, amit szeretek és nem vágok. De gyakran gyakran be kell olvasnia az előnyöket, gyakran a számítógépet, gyakran vastag papírdarabokat és papírdarabokat - a legjobb hely nekik. És az ideje, hogy átkutassa az üvegen, sajnálom, hogy elpazarol.
Még egyszer a szkenner alapbeállításairól. A felbontás 300 dpi és a színes mód "szürkeárnyalatos" vagy "színes". A fájlformátum TIFF.
A könyvoldal milliméterben történő mérésével meghatározhatja a hosszúságot és a szélességet. Természetesen "az üvegen" csak megközelítőleg lehet megtenni, mivel lehetetlen pontosan elhelyezni a könyvet az üvegre. A lap scanner kiszívja a lapokat egy sima oldala (alsó / felső, vagy ha az oldalon, akkor van szükség, hogy a lapos oldala), majd minden lesz pontosan le a milliméter. Az ő lap scanner Nemrég, mert a veleszületett lustaság, válassza a „javítják a szöveget» (szöveg javítása), amely »uzhirnyaet« és »uchernyaet« szöveges és rontja a színes illusztrációk (eltúlozza) és az opció »align kép« (torzításmentesítés ), mivel a lapokat még könnyebb feldolgozni. De nem választhat más lehetőségeket, kivéve a dpi és a színt, és minden mást hagy a tisztítási szakaszban.
A tisztításhoz a ScanKromsator v 5.9-et használom. Meg kell keresni az interneten. Egy kicsit köpöm a padlón, mert az interfésze miatt van, de ez csak az első, amíg megszokja. Ezután hagyja figyelmen kívül a fadikat észrevenni, és épp ellenkezőleg, észreveszi, milyen kényelmes ez vagy ezt megtenni.
A program leírásához kapcsolódó linkek:
A program, különösen a kezdők számára, összetett, de mégsem olyan összetett, mint például a Photoshop. Van még a ScanTaylor is, amely egyszerűbbnek ígérkezik, de még nem próbáltam meg. Bármelyik programot használják, szükség van rá
• távolítsa el a pultot
• Vágjon le egyenetlen széleket
• Illessze a megvilágítást (távolítsa el az árnyékokat egyenetlen megvilágításról)
• távolítsa el a pontokat és más törmeléket (lefejezni)
• külön-külön ellenőrizze / javítsa illusztrációkat (beleértve a fedelet)
• Állítsa a felbontást 600 dpi-ra, ha kisebb felbontásban szkennel.
Miután a ScanKromsator átmegy az oldalakon (azaz a folyamat gombra kattintott), megnyílik egy ablak az eredmény (eredmény nézet) ellenőrzéséhez. Ebben az ablakban vannak olyan pótolhatatlan eszközök, mint a radír, a "mágikus tisztítás" és a színválasztás. Ne derüljön el, hogy használhatja őket egyes, különösen koszos oldalak egyéni tisztítására.
Ön is meg tudja ezeket a hibákat oldalakon a marginális megjegyzések (kivéve persze, nincs célja, hogy megmentse őket), törli a ceruza vonalakat, kiemelve a szövegben (zavarja a program az OCR, ami elviszi őket egy menetrend), távolítsa el a sávok, foltok, és néha a háttérben. Egyszer kék betűkkel beolvastam egy kék színű könyvet; háttér jött csúnya, és én egyszerűen eltávolítható a segítségével a „mágikus kezelés”, azaz a. e. változott fehér, mert ő egy kicsit könnyebb szöveget és lehet megsemmisíteni, ha eltávolítjuk a színét.
„Cheka-GPU - a szervezet célja, hogy megbüntesse, és ha egyszerűen ábrázolni a helyzet - nem csak büntetni, de hogy valóban büntetni a világ más volt észrevehető népességnövekedés, köszönhetően a munka a mi GPU.”
3. Fordítás a végleges formátumba
3. Fordítás a végleges formátumba
Tehát ... a megfelelő formát lefordítjuk a könyvet. Itt csak a PDF formátumot tekintem, mint az egyetlen egyszerű, gyors, bíboros megoldás a "formátum" kérdésre ... állni. Valahol már elmondtam. Igen, igen. Nos, igen, sok olyan formátum létezik, amelyben lefordíthat egy könyvet, beleértve a "szöveget". Mint, ha elolvassa a könyvet - olvassa el. Csak olvassa el megfelelően, majd letöltötte az internetről egy könyvet szöveges formátumban - itt beírtak a tenger.
Megmagyarázom, hogyan készíthetek könyvet PDF formátumban a ClearScan technológiával. A ClearScan egy fejlett technológia. Ha a PDF maga nem ideális a letapogatások tárolására (nagyméretű fájlméretet eredményez, vagy rosszabb minőségű képeket nyomtat), akkor a ClearScan használata esetén ez a formátum az ideális megoldáshoz közelít.
Fordíthatja a könyvet szöveges formátumban - TXT, RTF, DOC végre, vagy HTML és XML EPUB és FB2. De ez újra kiadja a könyvet. És lehetséges, hogy a kiadás során teljesen vagy részben elveszítik a könyv tervét. Szükséges-e ez, ha a könyvet már közzétették? Természetesen ez rajtad áll. Ha a design kicsi, akkor újra közzéteheti. És ha sok mindent meg akar menteni? És egyszerűen nem akarnak időt vesztegetni az újra kiadásra? Ezután a "DJ" vagy "PDF" (valaki "tapsol" és a PowerPoint-ban) "lecsúszik" a könyvet, de ez tényleg sajnálom, hogy "végül"). Ezek a formátumok "kis TIFF-ként" állnak - a könyv grafikus formában marad, de kevesebb helyet foglal el.
A ClearScan technológia lényege, hogy az OCR színpadon található betűk képét valódi betűtípussal helyettesítse. Ez a betűtípus nem olyan kész (rendszer) betűtípus, amely többé-kevésbé hasonló az eredeti betűtípushoz, de egy speciális betűtípussal, amelyet az Acrobat program "menet közben" készít a szöveg egy adott betűjéhez.
Ennek eredményeképpen a grafika formátumú oldalának helyett egy (szinte) valós szöveg jelenik meg, formában (majdnem) ugyanaz, mint az eredeti.
A cikk szerint és a gyakorlatban bevizsgálva a legjobb eredményeket az eredeti (600 dpi) felbontás és az oldalsó zavarás hiánya (szemét, tárgyak) az eredeti felbontásban érik el. Ezért a kép tisztítása a szkenner után (a megvilágítás összehangolása, a törmelék tisztítása és a felbontás 600 dpi-ra növelése) szükséges a jó minőségű szöveg és a legkisebb fájlméret eléréséhez.
Hol kaphatok Adobe Acrobat 9.0 vagy újabb verziót? A fejemben egyet <нехорошее слово>. De miért tanítalak rossz szavakat? Tudják velük. Ezért, mint egy egzotikus alternatív megoldás, egy aukcióval állítottam össze, mondjuk az E-bay-t, dial adobe acrobat 9 pro-t, és nézd meg, hogy meg tudom-e kapni, amit akarok egy elfogadható áron. Tegyük fel - tudod. És az Acrobat is.
Az Acrobat futtatása után válassza ki a tisztítás után kapott TIFF-eket. Ehhez kattintson a Fájl → Csatlakozás → Fájlok egyesítése egy PDF-fájlba. Megnyílik egy ablak, amelyben mi
• jobb felső sarokban válassza az Egyetlen PDF-t (valószínűleg már kiválasztott)
• a jobb alsó sarokban, ahol három oldal látható, válassza ki a legnagyobb oldalt a jobb minőség érdekében
• Kattintson a Fájlok hozzáadása ^ Fájlok hozzáadása és az összes TIFF hozzáadása lehetőségre. Az összes fájl egyszerre történő hozzáadásához kattintson az első fájlra, majd tartsa lenyomva a Shift billentyűt, és kattintson az utolsó fájlra. Nyomja meg a Combine Files és türelmesen várni az eredményre - egy fájl PDF formátumban.
4. OCR a ClearScan opcióval
4. OCR a ClearScan opcióval
Nos, futtassa az OCR-t ugyanabban az Adobe Acrobatban. Ehhez a Dokumentum - OCR szövegfelismerés - a szöveg felismerése az OCR használatával és a megnyitott ablakban kattintson a Szerkesztés gombra a Beállítások részben. Mi választjuk
• Elsődleges OCR nyelv - adja meg a dokumentum fő nyelvét
• PDF kimeneti stílus - állítsa be a ClearScan beállítást
• Képek lecsökkentése - általában alacsony (300 dpi).
Várjuk az egykori türelmét, de jobb nyaralni. A kimenet a kívánt PDF. Keressétek meg egy levelet, és kezdenek megemelkedni. A levélnek minden növekedésért egyértelműnek kell lennie.
Kész. Ne felejtse el menteni a fájlt.
És ez az ... Ne csípje be ezt a fájlt az Acrobat-ban a lemezterület mentéséhez. Nem is fogom elmondani, hogyan. Ne rontsd el a fájl minőségét, és a mobileszközökön, ahol a processzor gyengébb, és a PDF megtekintésére szolgáló program nem olyan okos, hogy ilyen zsúfolt könyveket kínozzon.
Próbálja dobni a könyvet mobileszközön - nekem ez egy iBooks olvasó iPad. Milyen jó néz ki! Milyen gyorsan tudom átfordulni az oldalakon! Kulcsszavak keresése! Diákok! Szkennelje a könyveit! Anya és apa! Kérjük, keressen jó gyerekkönyveket!
És ne felejtsük el elhelyezni őket az elektronikus könyvtárba.
Kuznetsov elvtárs, Ivan Ivanovics írta Petrov Fülöp Fedorovics elvtárs szerint, aki mindezt szürke egérről hallotta.