Alapelvei munka pdf-fájlok - Translation enciklopédia
Nézzük az egyes tényezők még:
Védett ha küldik PDF jelszó
Jobb, de gyakran nem problémamentes, és a fogyasztó értékes időt - alkalmazni kell az ügyfél azzal a kéréssel, hogy küldjön nezaparolenny fájlt (és általában jobb, forrás). Ilyen kérelem esetén a támogatott foglalkoztatás-növekedést árak ügyetlen fájlt, és az ügyfél kéri a munkát az Ön számára, akkor csodák történnek néha.
A jelszóval védett PDF-tartalom a tilalmat a másolás
Normál betűtípus elrendezés
Ellenőrizzük, hogy a kereskedelemben szokásos font file elrendezés (Ez a probléma még súlyosabb az orosz dokumentumokat, de mégis, tudnunk kell azt). Ha a kijelölt szöveget, és beiktatjuk egy másik program rendesen, a teljes dokumentum helyes font. Ha azt látjuk, süllyesztés kryakozyabry vagy üreges - betűtípus elrendezés helytelen. Keresés ezekben a dokumentumokban nem fog működni is.
PDF rossz font elrendezés
Attól függően, hogy a kritikus, a dokumentum száma és a betűtípusok, és jelek, amelyek korrekciót igényel a felismerés után, hogy működjön együtt az ilyen dokumentumokat két módszer segítségével: a korrekció az elrendezés Infix PDF Editor, majd mentse kivonat és szöveges vagy elismerést. Úgy véljük, a második, míg azok, akik információkat talál az első.
Vannak sok a dokumentumban táblázatok, illusztrációk, egyéni karakter, és így tovább. N.
Mivel nincsenek táblázatok PDF fogalmakat, majd tanulni belőle standard technikákkal asztal, és még néhány PDF -konverterami lehetetlen. Ezeket a dokumentumokat a könnyebb felismerése. Ugyanez vonatkozik a bőség táblázatba megosztottság, fej- és lábléc, illusztrációk képaláírásokkal, áramvonalas szöveget. Kivonat mindezt megfelelően a szövegben a szabvány nem válthatók, és a költségek így az eredmények is ezt a normális megjelenés gyakran meghaladják a szükséges időt manuális OCR a FineReader. Azonban a fejlesztők felhő TM Smartcat azzal fenyeget, hogy egy csoda, de nekem úgy tűnik, hogy ez lesz a születés egy másik egér hegy.
Eredmény copy táblázatos adatokat egy PDF
Az eredmény utasítás felismerés táblázat PDF
oszlop dokumentum
Itt is meg kell nézni. Gyakran a közvetlen kivonással és automatikus elismerése FineReader több oszlopot esnek egy egység, és a kimeneti eredmény szörnyű. De, ellentétben a szokásos eszközökkel kivonására szöveget PDF. FineReader lehetővé teszi számunkra, hogy testre az egységeket el kell ismerni. Óvatosan oszlopos szöveg kijelöléséhez a dokumentumból az Acrobat Reader gyorsabb lesz a dokumentumok mennyisége akár 30 oldal. Azonban egy ilyen folyamat szöveggé (szaggatott vonal összekapcsolása, stb.) A feldolgozás természetesen automatizálható, például a reguláris kifejezések. De ez már túlmutat a jelen dokumentum.
Előírt formátum kimenet
Ezért úgy döntöttünk,. Van egy összetett dokumentum - felismeri. A feladat - lefordítani angol, magyar ki ahelyett, hogy a francia kapott az angol-orosz-német papír oldalas eredeti. A formátum az eredményül kapott dokumentum - MS Word doc (x). Szövegfordítási a képen, hogy a lemez „eredeti - fordítás” a kép alatt.
Tehát, ha megnézzük a dokumentum, azt látjuk, hogy ez a három-oszlop, és minden oszlop egy külön nyelv. A legegyszerűbb módja annak, hogy jobb szöveget asztalok elrendezését, ahol minden egyes oszlop egy külön nyelv.
Ha megnézzük többet a PDF-dokumentumokat feldolgozó áramkör, azt látjuk, hogy az elrendezés, ahol a nyilak célzó szakaszok előtt és után transzfer. Mit jelent ez?
Előírni a végleges dokumentum egyaránt lehet előtt és után transzfer. Minden megoldás van előnye és hátránya.
Előnyök elrendezés fordítás után
Kevesebb időt töltött vorstku mint typeset dokumentumot közvetlenül tiszta másolatot. Ha előre vorstke fordítás után sok eleme miatt a nagyobb hosszúságú szöveg a magyar összehasonlítva az eredeti angol és funkciók (például a kis területen) is elúszik vagy áthelyezni egy másik oldalra. Ez szükségessé teszi a korrekciót a folyamat lektorálás.
Lehet dolgozni a sima szöveg nélkül tgov.
Lehetőség van, hogy tovább javítsa az olvashatóság a kész szöveg elrendezése.
Ha jelentős módosításokat a fordítás vagy meg kell hagyni a nyers TM vagy még elő, vagy párhuzamosan a helyes és a TM és a szöveg, amely nem járul hozzá sem a minőség és a hatékonyság.
Minden felsorolás bekezdések (felsorolásjeles és számozott) fekszenek TM, felesleges interferenciát szegmensek hasonlóságnak kiértékelési algoritmusok.
Segítségével a mezőket a dokumentumban lefektetett nesvorstannom dokumentum fordítandó szöveg lesz.
A fordítást illeti, általában több téves szöveget (azaz a felismerési hibák), azaz. A. A vorstke a hiba megszűnt. Ez megint csak nem a legjobb módja hatással van a tartalom-alapú fordítási pár (azaz. N. fordítási memóriákat).
Tökéletlen szegmentáció, javíthatatlan néhány TM programokat.
Helymeghatározás a fordítás
Itt a kép megfordul. A szükséges idő mindkét módszer megközelítőleg azonos, és a választás inkább függ a folyamatban is - valaki hozzászokott, hogy gyorsan TM tervezetet, majd a „nyalni” párhuzamosan a kivetését MS Word vagy OO Writer. Ahhoz, hogy tiszta másolatot van szükség a TM, előre vorstke nincs alternatívája. Gyere, és mi ezt az utat.
Ha helyesen ragadta meg a fentiekben felvázolt elképzeléseket, a FineReader kell, hogy valami hasonló a következő kép:
Rendszer overlay blokk és a felismerési eredményt a FineReader
A képet a központban való kombinálásával kapjuk a táblázat sejtek, és meghatározzák a zászló „Cella képként kezelése”.
Tud hasonlítsa össze az eredményeket FineReader automatizált fájl feldolgozása. Ez a példa, bár valamilyen rendkívüli helyzet, jól illusztrálja a képessége automatikus átalakítók kihívásaira adott pillanatban. De az ilyen problémák szakfordítás többség.
Export eredmények Szó a „Táblázatok bekezdések és betűtípusok” üzemmód (A későbbi verziókban, ez az úgynevezett „Plain Text”), hogy mentse a képet fogunk csinálni a készítmény lehet behozni a TM.
Ablak beállítások mentése felismerési eredményeket MS Word beállításait a FineReader 8
Először is, távolítsa el ismétlődő terek (a legújabb verzióját FineReader ezt automatikusan, amikor exportálja, de nem szünteti meg a kötőjeleket - akkor is meg kell törölni manuálisan), törölje a szöveget a francia oszlop, és a helyes problémákat a többi. Bulletirovannye bekezdések bulletiruem
, felsorolások felsorolni gép , fejezet számát és végén felsorolt a dokumentum (miután Ahol) választható, levehető fülek.Másolás az angol neve helyett a francia, és távolítsa el az attribútum „rejtett”. Ismételjük meg a műveletet az összes cella a mi asztalon. Mentse el a kapott fájlt.
Azoknak a felhasználóknak más TM programok importálni lehetőségeket, és a megfelelő alkalmazkodási a formátum az eredeti dokumentumot hagyja a házi feladatot.
Behozni a TM programot (itt DejaVuX3) dokumentum
Nem a szépség néz ki, mint a következő kép
Példa dokumentum eltömődött címkék (a DejaVuX)
Fordítás, export, és ha minden rendben van, megkapjuk a kész fordítást. Field méretek elegendőek, hogy át nem nyomjuk az oldalt. Mivel a kép minősége gyenge, akkor meg kell fordítani kézzel.
Ellenőrizze, hogy minden rendben van. Felfedezett hibajavítások. Ha a szöveg nem fér el az oldalon, akkor csak nyomja a tábla oszlopának (ha a mező lehetővé teszi), enyhén csökkenti a font (0,5 pont), válassza ki a betűtípust tömöríteni. Előnyösebb 2. lehetőség, de a dokumentumot nézett, a betűtípus lesz csökkenteni kell az egész orosz szöveget.
Ezen a leckét befejeződött.
Megértem, hogy a kérdések a dolgozó FineReader, és az elrendezést MS Word már lefedett nagyon homályos, de mindegyik megköveteli 5-7 oldalnyi apró betűs. Talán majd máskor.