Megjegyzések a térd, egy oktatási program DjVu

Most a hálózat teljes anyag körülbelül ez nem egy új elektronikus dokumentum formátum. És mégis, találtam egy cikket, hogy világos, tömör és könnyen hozzáférhető lenne mindent elmondott. Olvasói levelek csak megerősítik azt a tényt, hogy a rengeteg anyag nem járul hozzá a megértése ötleteket. Én vagyok a legjobb a mérsékelt erők hatására megpróbálom megjavítani.

DjVu (ejtsd: „deja vu”), mint adattároló formátum által kifejlesztett ATT a '90 -es évek közepén. Úgy tűnik, méltó használata mindez nem volt idő, mert hamarosan minden használati jogokat adtak el a kevéssé ismert LizardTech. Ő viszont csiszolt egy sor programot, hogy működjön együtt ebben a formátumban, és mindent fel eladásra. Mivel az ár már csak égig, az értékesítés várhatóan egyszerűen nevezetesen hajtható végre. Végén a forrás fedezte leírásával együtt a formátum. Jelenleg részt LizardTech térképek, tárolása és a program formátumának manipulálni őket, de ez egy kicsit más téma.

Tovább kerékpár?

DjVu mentes Mindezen hátrányok. Dokumentum mérete kiderül kicsi, gyönyörű felbontású (a legtöbb könyvet beszkennelt 300 vagy 600 dpi). Kell print - kérem. Ot'OCR'it akar - könnyen. Keresés - építési beruházás, ha létrehoz egy szöveges réteget is (könnyen hozzá, majd anélkül, hogy visszacsomagolásához Az összes oldal). És mindenütt és mindig utf8, nem bakugrás nem kell, hogy gondoskodjon a kódolás tárolására szöveges információ.

Fóliázás DjVu

Úgy gondolom, hogy a legtöbb technikai részletek nem érdekli, és alkalmas lesz, hogy nyomja meg a gombot a „Vissza”. A fennmaradó beszélni egy kicsit a belső formátum.

Minden információt belül DjVu képviselt formájában darabokat (darabokban). A fájl maga egy nagy darab, amelynek belsejében kisebb darabokra. A fájl lehet egy- vagy többoldalas, abban az esetben egy többoldalas fájlt adunk a lap tetejére könyvtárban. Meg kell jegyezni, hogy a szám a darabokat a fájl nem áll arányban az oldalak számát, mert jó pár darab lehet használni oldalleképezés.

Mi az új kitalált DjVu formátum?
Ellentétben GIF / JPEF / PDF és más oldalon a dokumentum lehet osztani több rétegben. A legáltalánosabb esetben az előtérben, backgroung, elválasztották a két maszk réteg és további szöveges információkat. A kódolási folyamat egyfajta művészet, hogy megosszák egy beszkennelt dokumentumot rétegekbe, és meghatározza, hogy mi kerül az előtérbe, hogy a háttérben eredményeként tömörítés. És a legnehezebb része az algoritmus - ebben. Ezért, mint már mondtam, a kereskedelmi kódolók általában jobban működnek DjVuLibre, mert vannak kifinomultabb algoritmusok.

Z-coder.
Aritmetikai kódoló / dekódoló, amely az alapja minden transzformációk DjVu. A működési elve hasonló a használt BZIP2 algoritmus. A részletek megtalálhatók a [4]. Ez a kodek szűrőként használható - létrehozásában darabokat kimenet és a bemenet, mielőtt megjelenne rétegeket.

JB2 jeladó.
Ezt alkalmazzák a csomagolás bitonal adatokat, például szöveget, fekete-fehér rajzok és így tovább. Meg lehet tárolni maszk, azaz információt, hogy beleesik a háttérben használt, és az előtérben. Minden információt tárolnak egy könyvtárat (szótár) forma (alak), valamint a helyzet az egyes tárgy síkjában az oldalt. A könyvtárak maguk közös lehet több oldalt. Ez a legkönnyebb elképzelni olyan. Például ott van a beolvasott szöveg jeladó érzékeli hasonló bukovki, mondjuk az összes „a”, „b”, stb, és hozzon létre egy könyvtárat, amely információkat tartalmaz az egyes betű (forma), majd csak azt az információt, hogy az „a” van egy ilyen és erre a helyre, a „b” így és így és így tovább. Mert, mint mondtam, talán megosztja a szótárban oldalak között, csomagolás fordul brutális. Amellett, hogy mindezt lehet menteni tájékoztatás a színes formák, azaz, ha van, mondjuk, egy piros „A” és a kék „a” a leolvasó, a könyvtár lesz csak egy „a” lesz rögzítve információt a helyét a két formája " a „és a színük. Színes tárolja indexált formában ugyanúgy, mint a GIF fájlokban.

Az aláírás chunk a JB2 réteg - „Sjbz”, utalhat a külső könyvtár formák - „Djbz” csonk. Információk a formák virágok darabokban „FGbz”.

Minden ilyen darabokat arattak Z-coder'om.

Az aláírás darab a háttér réteget - „BG44”, előtér - „FG44”.

Ismét, az összes ilyen darabokat arattak Z-coder'om.

Egyéb információ.
Text Layer - 'TXTz'. A felismert szöveg együtt annak elhelyezkedését az oldalon. A hely adatai detalizovannye a szavak vagy a sorok. Ez a réteg lehetővé teszi, hogy a keresés kiemeléssel megtalálható az oldalon és az index DjVu dokumentumok.
A kommentárok - 'Antz'. Linkek és információk, hogy mely rétegek megjelenítéséhez alapértelmezés szerint, ha a fájl megnyitásakor.

'TXTz' és 'Antz' áthaladt a Z-coder.

Ezen felül, akkor lehet kódolni információt kódoló (darab „CIDA”) és így tovább. Nincs egyértelmű szabvány, de ez az információ alapvetően nem szükséges a normális dekódolás.

méret korlátozásokat.
  • Maximális lapméret 65535x65535px
  • Hiányában az ellenőrző belül a formátumot, és darabokat (törött fájl még kicsomagolva, de a kása obszcén). A gyakorlatban - jobb archiválni DjVu fájlokat, amely biztosítja azok épségét
  • Hiánya titkosítás és korlátozások az információk felhasználását (DRM Javasolja csendben dohányzás félre). Nos, ez nem a korlátozás, hanem egy plusz. Amennyire én tudom, ott már kísérletet, hogy egy biztonságos DjVu alapján a szokásos, de semmi jó történt

Íme egy rövid, meg minden. Különleges igények lásd a forrás DjVuLibre. Örülnék, ha az információ segített a kérdések megválaszolására és megérteni a témát.

Leon Bottou számára értékes információkat a belek DjVu.