Az ábrázolt könyv szerint Oroszországnak egyetlen elektronikus könyvtárra van szüksége, a hivatalos blog abbyy

Az ábrázolt könyv szerint Oroszországnak egyetlen elektronikus könyvtárra van szüksége, a hivatalos blog abbyy

Ma sokan beszélnek a könyvtárak és az archívumok digitalizálásának fontosságáról. ABBYY-ban tudjuk, hogy mit jelent az egész könyvtár digitalizálása és készen áll arra, hogy tisztázza e nagy léptékű és összetett feladat egyes aspektusait.

Miért olyan fontos a könyvek digitalizálása és helyes módja, mondja Dmitry Shushkin, az ABBYY Russia vezérigazgató-helyettesének a Forbes honlapján. Elolvashatja a cikket a blogunkban, reméljük, érdekelni fogja.

A kulturális örökség biztonságát és hozzáférhetőségét korábban a kormány és az érintett minisztériumok szintjén hozták. A legtöbb megbeszélés azonban nagyon általános volt. A résztvevők gyakran nem értik, hogy mit jelent az egész könyvtár digitalizálása. Meg kell ABBYY igazi élmény a részvétel az ilyen projektek voltunk aktívak a digitalizálás az egyes orosz és külföldi könyvtárak és technológiai partnerek már nagyszabású nemzetközi projekt a kulturális örökség megőrzését - Gutenberg és a META-e.

Megpróbálok tisztázni a könyvtárak és az archívumok digitalizálása néhány tisztán technikai és értékes - minden szempontból - szempontját, amelyek feltárják a probléma valódi skáláját és összetettségét.

Miért kell digitalizálnia?

Az első feladat a könyvek letapogatásával menteni. Természetesen régi kötetet, bibliográfiai ritkaság nem lehet teljesen mentett egy digitális másolatot, általa szolgáltatott a textúra a papír, a művészi értéket a képek, a fény játéka, pergamen, stb, de más esetekben, a könyv - .. Van, először is, a tudás forrása, információk, .

A második feladat az, hogy a könyveket számos olvasó rendelkezésére bocsássák. És ehhez nemcsak a szöveg beolvasására, hanem felismerésére is szükség van. Mivel az emberek általában nem kell képeket oldalak, vagyis maga az információ, amely letölthető a digitalizálás a megfelelő elektronikus formátumban, és sokkal kisebb mértékben, mint a forma vizsgál.

Az orosz könyvtárakban már megkezdődött a legnagyobb és legértékesebb archívum, valamint a digitalizálási folyamat. Például az RSL már beolvasta körülbelül egy millió kiadványt és dokumentumot (összesen mintegy 45,5 millió egységet tartalmaz). A tempó lassú, de a kezdet már megtörtént.

A könyvek digitalizálása

A szkennelés előtt el kell döntenie, hogy pontosan mi lesz a digitalizálás. Ha kiderül, hogy egyes könyvek rossz állapotban vannak, és egyszerűen összeomlanak a beolvasás során, akkor gondoskodnia kell róla, és lehetőség szerint helyre kell állítani és visszaállítani őket.

Ha a szkennelés vagy képeket a régi és rozoga könyveket, sőt felújított, ebben a szakaszban speciális feltételek szükségesek a munka és a speciális felszerelések - ki kell használni a „mágikus” eszközök V alakú ágy a könyvek és lapozási rendszer, beleértve a levegő. Az ilyen szkennerek költsége meghaladhatja a 100 000 eurót.

Természetesen nem minden dokumentum igényel olyan óvatos és költséges kezelést.

A XIX-XXI. Század legtöbb dokumentumát hagyományos módon lehet beolvasni. De minden esetben a könyvek leolvasására szolgáló eszköz lassú, mert a dokumentumokat nem húzza át a lapolvasón, de automatikusan vagy manuálisan lapozzon oldalanként. Tehát a könyvek letapogatása nem megy át, mint a csomagok szkennelésével. Ez egy nagyon időigényes és drága folyamat.

Az elismerés eredményeinek ellenőrzése meglehetősen hosszadalmas és időigényes munka, amely azonban a crowdsourcing segítségével történhet, és a nagyközönség számára bízhat. Így például amikor Leo Tolstoi 90 kötetes könyve digitalizálása során 3000 önkéntes volt, év közben és 45 év alatt sikerült több mint 45 000 oldalt digitalizálni.

Az ábrázolt könyv szerint Oroszországnak egyetlen elektronikus könyvtárra van szüksége, a hivatalos blog abbyy

Hogyan hozhat létre országos digitális könyvtárat?

A nemzeti könyvtárak és irattári alapok digitalizálására irányuló program szisztematikus megközelítést és jól kidolgozott tervet igényel.

Például, hogyan lehet eldönteni, hogy melyik anyagot írja be először? Egyrészt az elektronikus formában való lefordítás helyes módja a leggyakrabban olvasott és leggyakrabban használt könyvek és dokumentumok. Másfelől nyilvánvaló, hogy egyedülálló és értékes könyvekre van szüksége, amelyek egyetlen példányban léteznek.

Hogyan lehet csökkenteni a munka többszörözésének veszélyét a különböző könyvtárakban - mivel a könyv digitalizálása nem olcsó?

Úgy tűnik számomra, hogy egy ilyen projekt első szakaszában létre kell hozni egy katalógusot vagy nyilvántartást minden tárolóeszközről. És jobb, ha ezt "alulról" hajtod végre. Így például: a könyvtárak és az archívumok fogalmazzák meg a digitalizálás iránti igényüket, amelyek alapján összegyűjtik az egyes alkalmazások gyűjteményét. A megbékélés, a kettős elbírálással és a névrendezéssel kapcsolatos problémák megoldása után ez a pool lesz a katalógusunk.

Ebben a szakaszban egyébként figyelembe veheti a könyvtárak által már elvégzett munkát is: elsősorban a katalógusok szkennelését végzik, így az olvasók távolról olvashatják a könyvek listáját. Ezért egyetlen katalógusunk egyes részei már készen állnak.

Ezután egy egységes katalógus alapján lehetőség nyílik a digitalizálás részletes tervének kidolgozására, amely az összes állami levéltára és könyvtár számára egységes és egységes.

Mennyi pénzre van szükség

Ha tapasztaltad a streaming szkennelést, akkor tudja, milyen egyszerű. Egy erőteljes szkenner egy sornyi dokumentumot helyez el, a szkennelés és felismerés csaknem teljesen automatikusan történik, és végül egy teljesen digitalizált irodai archívumot kap. Továbbá ellenőrizni kell, vagyis az elismert adatok összeegyeztetését, automatikusan vagy manuálisan elvégezhető. Mindenesetre ezzel a módszerrel a digitalizálás költsége oldalanként több rubel lesz.

A könyveket - különösen ritka és régi példányokat - nem lehet ilyen módon szkennelni, így beszéltünk erről. Mivel a bonyolultabb szkenner Recognition (furcsa betűtípusok, összetett hátterű, stb), vagy több kemény munka az emberek az áremelkedés az oldal digitalizálását tíz vagy akár több száz rubelt.

Annak érdekében, hogy ne bonyolítsuk a számításokat, vegyük fel az 50 rubelt - annyira átlagban lehet egy digitalizált egy feltételes történelmi könyvtári alap. Tegyük fel, hogy a könyvtár átlagos könyve 500 oldalt tartalmaz. Mi lesz elegendő 100 millió rubelre? Körülbelül 4000 kötet közepes komplexitású. Ismétlem, "gömbölyű könyvekről van szó, vákuumban", vagyis minden könyvtár esetében ez lesz a saját összege. Úgy gondolom azonban, hogy a számok közelítő sorrendje érthető.

Az érthetőség kedvéért, azt fogja mondani, hogy a sérült a tűz központi könyvtár Inion, a hivatalos adatok szerint, tartalmazott 14,7 millió könyvet, amelynek boltozat Nakhimovsky Avenue volt 10,2 millió. A különbség, mint látjuk, három nagyságrenddel.

Digitizálás más országokban

A könyvek és dokumentumok digitalizálásának egyik leghíresebb külföldi projektje Gutenberg. 1971-ben indult. Keretein belül az önkéntesek digitalizálják és megőrzik a szöveges formátumban a világirodalom különböző, szabadon hozzáférhető műveit. Most a projekt webhelyén 45 000 könyvet tölthet le ingyen minden népszerű formátumban. És a projekt saját számlálója 4,5 millió letöltést mutat az elmúlt hónapban.

A régi könyvek digitalizálásának másik projektje, megérdemlik a META-e. Ezt az EU-országok is elképzelték és hajtották végre. A projekt keretén belül pénz került elosztásra a 16.-19. Században nyomtatott európai szövegek felismerésének számítógépes programrendszerének kidolgozására, szinte egyáltalán nem létező gótikus betűtípus felhasználásával.

Míg az európai könyvtárak digitalizálása sokkal több, mint az oroszoké.

Például a Francia Nemzeti Könyvtár honlapján, amelynek alapja az INION-hoz hasonló alap, több mint 3 millió könyv és dokumentum áll rendelkezésre. Reméljük, hogy a közeljövőben könyvtáraink képesek lesznek ilyen számok büszkélkedésére.

1. kép: Sharon Nikki McCutcheon, www.flickr.com

2. fotó: Michael D Beckwith, www.flickr.com