Hogyan hozzunk létre egy szótár a magyar nyelv egy számítógép és anélkül
Hogyan hozzunk létre egy szótár a magyar nyelv egy számítógép és anélkül
Alexander Kostinsky. A digitális technológia drasztikusan megváltoztatta számos ágazatban az emberi tevékenység. Néhány ezek közül látható, és a változások nyilvánvalóak, és néhány nem. Ma fogunk összpontosítani létre a hagyományos papír szótár, a példa a magyar nyelvű szótárak. Itt egy olyan térségben, mint ezer éves hagyománya van, túl drámai átalakulások fordulnak elő. Az ezerszer kibővített szótárban alap csökken sorrendben a készítmény a szótár és az ára jelentős mértékben csökkent.
Először Dmitry Dmitriev fog beszélni hagyományos technológiával szótárak.
Dmitry Dmitriev. Dolgozom Intézet Nyelvészeti Tanulmányok, Orosz Tudományos Akadémia szentpétervári, korábbi nevén a Nyelvtudományi Intézet. Itt van, hogy a legnagyobb fájl a modern magyar nyelv, amely kezdett kialakulni a 19. században, és továbbra is növekszik a mai napig. Mi több emelet tele nagy szekrények, amelyek beilleszthetők a dobozok.
Alexander Kostinsky. Szó minden kártyán?
Dmitry Dmitriev. Szó minden kártya és egy idézetet. Sok generáció ember könyvet olvas, írta ki a kedvenc darab.
Alexander Kostinsky. Az emberek az intézményben?
Dmitry Dmitriev. Nem csak. A munka és a sok önkéntest. Egy férfi egy könyvet olvasott, írt valamit, és hangsúlyozta, hogy a szavak, az ő véleménye, fel kell venni a szótárban. Így alakult nemzeti bejelentés. Az ilyen bejelentés, persze, vannak Angliában, Németországban és más országokban.
Alexander Kostinsky. És hány ilyen kártyák már felhalmozott?
Dmitry Dmitriev. Ők most mintegy hatmillió. Ma, a feladat fordítsa őket digitális formában - a retrospektív, de hogy ez nagyon nehéz, mert a kézzel írt kártyákat.
Alexander Kostinsky. Van egy elismerést a probléma?
Dmitry Dmitriev. Igen, szövegek yatyami, erami. Néha olvasása kártya nagyon nehéz.
Alexander Kostinsky. És hogyan kell építeni szótárak ezeket a kártyákat?
Alexander Kostinsky. És miért olyan nagy, 17 kötet?
Alexander Kostinsky. Szótárak készülnek sokáig?
Dmitry Dmitriev. Hosszú, hosszú ideig. Mellesleg, a második kiadás a szótár - dvadtsatitomny szótár -A nemzeti büszkeség, még még fel kell szabadítani.
Alexander Kostinsky. És mi történt kötetek?
Dmitry Dmitriev. Ez történt körülbelül hat kötetben, és ebben az esetben elakadt, mert megvan a szerkezetátalakítás és az elején a 90-es évek, amikor nem volt hiány finanszírozására, és így tovább. Sajnos, ez megrekedt annak a ténynek köszönhető, hogy a folyamat dolgozik a kártya nagyon időigényes.
Alexander Kostinsky. Ő is drága.
Dmitry Dmitriev. Persze, nagyon drága. És a szótárban változik térfogat-térfogat. Ha megnyitja az első három kötete a Bolsoj Akadémiai szótárban, akkor látni fogja, hogy ők építették kissé eltérő elvet, mint a későbbi kötetek.
Alexander Kostinsky. Változó ötlet, hogyan lehet a szótárakat. A karakterisztikus ideje a kiadvány a szótár több, mint a változás ideje a teremtés elméletének szótárakat.
Dmitry Dmitriev. Igen, valószínűleg. Vagy akár egy furcsa epizód: az emberek, akik bármilyen kifejezés, mint „kutya eszik”, balra egy szóval később, így a kapcsolat, azt mondják, ez fog történni a következő kötetet. És a következő kötet, a személy, aki ezt a dolgot, felejtsd el, hogy menjen vissza, és mi volt a hivatkozás a darab ábécé (összes adta ki egy darabot az ábécé). Tehát vannak linkek, melyek sehol. Ez is olyan probléma, amely számítógép nélkül nagyon nehéz megoldani.
Alexander Kostinsky. Ha megnézzük a háború utáni időszakban, és a forradalom után, az élet változik olyan gyorsan, olyan sok új szó, hogy a valódi szótárban egy ideig kellett leírni egy szót alap, és máskor a másik. Tény, hogy ez volt a nyelve fotózás álló darab különböző időszakokban.
Alexander Kostinsky. Van nem ABC sorrendben?
Alexander Kostinsky. cikkek szerkezetileg rakták már a kártyák jobb?
Alexander Kostinsky. És ha ezek a permutációk 09:55?
Dmitry Dmitriev. Éppen ezért a szótárak megy, amíg 30-40 éve, és eddig nem látjuk a polcokon üzletünkbe tudományos publikációk. Ugyanez Nagy Collegiate Dictionary, amelyről beszélek ma - ritkaság.
Alexander Kostinsky. Ki, mikor jött a digitális technológia, van némi elmozdulás, vagy továbbra is szétszórt kártyák, számozása?
Dmitry Dmitriev. Azt mondhatjuk, hogy ma ez a két hagyományok egymás mellett a felsőoktatási intézmények. Mi nem ösztönzi az összes szigorúan történik a számítógépen, de a kollégáim és én az Information Technology Laboratory kifejlesztett egy sor nyílt szoftver technológiák létrehozására szótárak, és felajánlja, hogy használhassa. Sőt, ezek a technológiák, mi egy sor szótárak a magyar nyelv (és nem csak okos), amelyet teljes egészében készült elektronikus formában. Mi az elejétől a végéig nem használtak papírt technológiát.
Alexander Kostinsky. Ez egy drámai változás - 4-40000 - a különbség két nagyságrenddel.
Dmitry Dmitriev. Igen, de nem akarom azt mondani, hogy a lexikográfus szó szól minden ilyen hivatkozások. Természetesen ez lehetetlen, de legalábbis ezek az idézetek mindig ott van előtte, úgy néz ki rajtuk keresztül, ki valamit, ami vonzza a figyelmét, ő is valahogy korlátozni kompatibilitás. De a bázis, az alapítvány választott ő hatalmas. Ha hirtelen kételkedik bizonyos kifejezések, mint például azt, hogy a „közvetlen” kialakítható összehasonlító fok „azonnal”. A józan ész azt mondja, hogy ez lehetetlen, de az adatbázis keresés során kiderül, hogy lehet, és egy ilyen dolog elég sok irodalmi szövegeket.
Alexander Kostinsky. Az első dolog, hogy az általunk azonosított - gyökeresen megváltoztatta a szótárban található. Mi más változott?
Alexander Kostinsky. A szöveg és a csodálatos, hogy nagyon kevés a számítógép erőforrásait.
Dmitry Dmitriev. Ez akkor fordul elő, ha dolgozik a nyílt forráskódú technológiák jelölő szöveget, ha használja a kódokat, hogy jelölje meg az összes zóna - az értelmezés a zóna zóna illusztrációk, nyelvtani területet.
Alexander Kostinsky. Egy kicsit többet arról, hogyan történik, mi tesz egy modern lexikográfus?
Dmitry Dmitriev. El tudsz képzelni egy modern szócikk egy hosszú tekercset, vagy ha a diákok, ez egy fájl, ahol minden sor tartalmaz néhány információs egység, például, hogy a marker [op] szögletes zárójelben, ami azt jelenti, elkezd idézet, majd nyomtasd ki szöveges hivatkozások és a végső marker. Sok diák valószínűleg ismeri a jelölőnyelv HTML, mellyel a Hypertext Markup az interneten. Igazából egyik változat az ilyen jelölés.
Alexander Kostinsky. Kezdetben, a személy kell adnia a szöveget elektronikus formában, akkor a kezdeti szakaszban a papír kártya.
Dmitry Dmitriev. Ha beszélünk a technológia sorozatunk „Academy magyar szótár”, nincs minden rendben. Mi már elhagyta a képernyőn quotational adatbázist, és a jobb oldalon a képernyőn, hogy írsz. Azaz, gyakorlatilag nincs papír nem használt technológiát.
Alexander Kostinsky. De az elején akkor már mind a kártyákat.
Alexander Kostinsky. A jelölést az eredeti szövegek cikkek vezet az a tény, hogy akkor majd automatikusan a szövegből, hogy cikkeket az adatbázisban.
Dmitry Dmitriev. Természetesen az a tény, hogy ez az elrendezés biztosítja a szabadságot, hogy hozzon létre a szövegben. Ön szabadon, hogy jöjjön fel a markerek szeretne, akkor nem nehéz adott szerkezet - ha szüksége van egy új típusú információkat, mondjuk néhány források szerint, vagy bekövetkezésének évében a szó vagy idézet, etimológiai információt, akkor egyszerűen felér egy új marker, elkezd használ, és csak úgy tájékoztatja az ügyvezetőt, hogy elkezdett egy új területen. Oleg Gardens A legfontosabb dolog, amit tehetünk, nyelvi adatbázisok, bizonyos információkat szakaszain a teljes mennyiség. Sőt, lehet, hogy egy teljes szótár, ahol az összes szóalakok, és lehet rövid szótárak, ahol több azonos adják rövidítve.
Alexander Kostinsky. Kap egy szótár gyárban.
Dmitry Dmitriev. A kiadó hajlandó volt együttműködni velünk, mert azt látják, hogy mennyire könnyű az, hogy a szótárak különböző formátumokban. Ha jön a boltba, és felajánlotta, hogy megvásárolja a szótár csak egy és fél ezer rubel, és ha nem, akkor rossz, és ha lehet választani a kívánt szótárt méretű, költséghatékony, a részletes kidolgozása, akkor van egy bizonyos mennyiségű szabad választás. Megpróbáltuk, hogy úgy, hogy ezeket a kis, közepes és nagy szótárak írt nem különböző emberek, de az egyik csapat.
Alexander Kostinsky. Kiderült, hogy egy általános adatbázis, amelyből meg lehet adni a munkát, hogy a különböző elrendezés szótárakat. Oleg kert különböző szótárak különböző formátumok különböző média típusok különböző megjelenési formát.
Alexander Kostinsky. Lehet, hogy ez igaz.
Dmitry Dmitriev. Valószínűleg igen. Legalábbis amikor megkaptuk ezeket az eredményeket, és természetesen, minden szót teszünk egy speciális ikon, ami azt mutatja, milyen gyakran használja azt a beszédet, néhány ember kíváncsi.
Alexander Kostinsky. Minden elő van készítve az elektronikus formában és hogy vannak-e elektronikus változatai ezek a szótárak?
Dmitry Dmitriev. Kezdetben, a szövegek formájában létezik elektronikus dokumentumok, ahonnan fogadására és nyomtatására, mint a papír szótárak merültek eredményeként automatikus elrendezés. Senki kifejezetten nem ül, nem hozott létre egy oldalt az egérrel.
Alexander Kostinsky. Kiderült, hogy van egy automatikus elrendezés szótárban.
Alexander Kostinsky. Ön használja megoldásokat találtak egy akadémiai környezetben külföldön?
Dmitry Dmitriev. Természetesen, bár nem mondhatjuk, hogy meg kell újra feltalálni a kereket. Éppen ellenkezőleg, azt követte a standard technológiákat, amelyek már fejlesztés évek óta Európában.
Alexander Kostinsky. Nem csak Magyarországon, így nem szótárakat?
Dmitry Dmitriev. Nem csak. Mi nagyon meglepődtek, mikor során együttműködésünk, mi szembesülnek angol szótárírók. Megpróbáltuk elindítani egy közös projekt velük. Úgy gondolom, hogy vissza fogunk térni a kétnyelvű szótárban. Ők küldtek minket az anyagok, és mi is meglepte, hogy ugyanazt a technológiát használja, és az Oxford szótár, amely rendelkezik a vezető pozícióját.
Alexander Kostinsky. Úgy tűnik, a logikája megépítésének szótár vezet a hasonló megoldásokat.
Dmitry Dmitriev. És akkor, hogy ez nagyon gazdaságilag megalapozott modell szerint. Oleg Gardens Ismét, ez rendkívül fontos a nyílt forráskódú technológiák, nyílt szabványokat. Amikor az emberek részt vesznek a kreatív munka általában van valami kész megoldást, hogy lehet menni a boltba és vesz nem illik - egy eszköz, amit tennie kell a maguk számára.
Alexander Kostinsky. Mondhatjuk, hogy nem csak a szakemberek, nem csak az emberek, akik eredetileg nem féltek a számítógépek, hanem a humán, ahol a humanitárius készül a magyar és az orosz-angol szótárak, ezek az emberek is tudják, hogy kivonat egy igen jelentős előny a digitális technológiák alkalmazásával.
Dmitry Dmitriev. Igen, nem csak lehet, de valójában csinálja. Csapatunk körülbelül 12 szótárírók, szinte senki egy műszaki szakértő ezen a területen. Tekintettel arra, hogy mi választottuk ezt a technológiát, akkor nekünk dolgozik. Nem volt programozói mindent megtett magunkat.
Alexander Kostinsky. És mennyi van a készítmény egy bizonyos szókincs egység.
Dmitry Dmitriev. Csak azt lehet mondani, röviden a költségvetés és a költségvetés, amelyek a Tudományos Akadémia. Érted hogyan történik minden Akadémián belül: az emberek jönnek dolgozni, ezek látszólag nagyon kicsi fizetések - másfél-két ezer rubel, de elvileg senki velük, és nem igényel semmit. Tudjuk, hogy hány éves, vannak olyan intézmények, amelyek a kérdést a hegyen nem túl sok termék. Ezért, ha megteszi a tiszta gyártási és osszuk ezek szerény fizetést, kiderül, egy lenyűgöző összeget. Azt töltött számítva kiderült, hogy ezek a szótárak, amelyeket készült hagyományos módszerekkel már magyarul használata közben támogatások, stb Az ára körülbelül 750 $ a 20 gépelt oldalt. Van egy költségvetési plafon körülbelül 100-120 dollárt a 20 oldalt. Sőt, kiderült, hétszer olcsóbb, mint a technológia.
Alexander Kostinsky. És hogyan sikerült közzé szótárak a sorozat?
Dmitry Dmitriev. Összesen tervezett 25 név, de most elfogyott öt. A többiek hamarosan elérhető lesz. A szempontból az elektronikus változat, készek. Problémák vannak a nyomtatáshoz. Oleg Gardens Ismét a korszerű technológiák alkalmazása, általában ad egy konkrét tartalék a jövőben, mert a jövőben az ilyen adatbázis, akkor lehet, hogy nem, és az ideiglenes szókincs szakaszok.
Alexander Kostinsky. Tovább számítógépes technológiák, így hatalmas lefedettség. Elvileg ez az öt millió kártyát lehet alakítani elektronikus formában. Chance szótár magyar nyelv, amely magában foglalja az ötmillió jelentése szó.
Dmitry Dmitriev. Természetesen mi átlépett korlátozza az összeget. Ez nem feltétlenül a házat, hogy a húsz könyve a szótár, ha nem tud egy CD-t és akkor mind előrelátható, egyetlen keresőmezőbe. Ez egyébként sokkal érdekesebb - dolgozni élő anyag. Ez a legizgalmasabb az írás egy szótár - nézd meg a valós életben a szó.
Alexander Kostinsky. És használja az internetet?
Dmitry Dmitriev. Természetesen. Internet - élő elem, amely kompenzálja a hiányzó friss anyag, amely gyakran megfigyelhető az ügyben. Alatt a test értjük egy sor elektronikus szöveg, amely működik lexikográfus. Elvégre, ha tudjuk, hogy a 95% -a teljes súlya a szöveg általában tele három-négy ezer szóval - jelzőket, és a maradék 5% tömegének szöveg, több száz ezer a többi lexikai alap. Internet használata, mint egy hatalmas erőforrás szövegek különböző műfajok: az emberek írnak, mert köznapi, szleng szót kultúrált irodalomban. Az interneten minden megtalálható. Ez nagyon érdekes, hogy nem egy aktív kereső a web szavak és kifejezések, amelyek tekintetében azt akarjuk, hogy végezzen egy kis kutatást.