Miért van szükség a nemzeti lakóingatlan
Hogy van az országos szervezetben?
Orosz Nemzeti Corpus fogalom elsősorban az időszak közepén a XVIII elején a XXI század: ebben az időszakban az, hogy a nyelv a korábbi korok, és a modern, a különböző társadalmi-nyelvi változatok - irodalmi, köznyelvi, népi, részben nyelvjárást. Az alváz tartalmazza az eredeti (nem transzlálódó) irodalmi mű (próza és a dráma, a továbbiakban is a költészet), amelynek kulturális jelentősége, valamint az érdeklődés szempontjából nyelvet. De a Nemzeti testület semmilyen módon nem az egyetlen szakirodalom nyelvet. Amellett, hogy az irodalmi szövegek a szervezetben nagy mennyiségben tartalmaznak más példákat írott (és a jelenlegi szakaszban - és beszélt) nyelv: memoárok, esszék, újságírás, ismeretterjesztő és tudományos irodalomban, nyilvános beszédet, magánlevelezés, naplók, dokumentumok és így tovább. n.
Orosz Nemzeti Corpus jelenleg tartalmazza a következő alkorpusz:
Mélyen annotált korpusz. amelyben a teljes morfológiai és szintaktikai szerkezete (Függőségi fa) épül minden egyes javaslatot;
Orosz-angol párhuzamos korpusz. ahol megtalálható az összes fordítás bizonyos orosz vagy angol szavak és kifejezések;
ház nyelvjárás szövegeket. beleértve a rekord a nyelvjárási beszéd különböző régióinak Oroszországból megőrzése a nyelvtani jellemzői; Van egy speciális kereső, figyelembe véve a morfológia a nyelvjárás;
teste költői szövegek. amely lehet keresni nemcsak a lexikai és grammatikai, hanem a konkrét jellemzőit a sor (search bizonyos kombinációkban szonettet epigrammáit, egy verset írt amphibrach, egy bizonyos típusú rím, stb ...);
képzés alakulat az orosz nyelv - esetében a pontosítás, jelölés, amely középpontjában a tananyag az orosz nyelv;
Minden szó és a szöveg Corpus tulajdonított nyelvi jegyzet alapján egy speciális szabvány kifejlesztett részvételével vezető orosz szakemberek.
Szerint a RAS levelező tagja AM Moldovan, az Intézet igazgatója az orosz nyelv. VV Vinogradov Tudományos Akadémia, „a teremtés és az Orosz Nemzeti Corpus az a feladata, valóban országos jelentőségű, mint a legtöbb nagy világnyelven már megvan a nemzeti szervek szövegeket. A megoldás erre a problémára hiánypótló a hazai nyelvészeti és fordítási tanulmányok és tanítása az orosz nyelv minőségileg új feltételeket. Túlzás nélkül elmondható, hogy az Advent a hadtest az első alkalom, hogy az anyagi alapot objektív és megbízható ítéletet a jelenlegi állapot és a fejlődés útjának az orosz nyelvet. "
A ház célja, hogy bárki érdekelt kapcsolatos kérdések az orosz nyelv: hivatásos nyelvészek, nyelvtanárok, a tanulók és diákok, külföldiek tanul orosz nyelvet.
„Örömünkre szolgál, hogy részt vettek a projektben, - mondja Ilja Segalovich, technikai igazgatója Yandex. - nyelvtanilag annotált korpusz nem csak egy módja annak, hogy megtanulják a nyelvet, hanem jelentős társadalmi eszköz létrehozására és testreszabására szoftver, dolgozó orosz szövegeket. "
Ezen az oldalon lévő National Corpus az orosz irodalmi nyelv fogant, mint egy univerzális eszköz, amely hatékonyabb működését mindazok részt vesznek a tevékenysége során a modern orosz irodalmi nyelv, vagy csak érdekli a feltétel és működtetése a nyelvet. A burkolat csatlakoznia kell a család meglévő nemzeti szervezetek más nyelvek - mint például a British National Corpus, National American Corpus, Tresor de la langue francaise et al.
Nyelv Corpus - gyűjteménye egy bizonyos módon kiválasztott (támogatott filológiai szakértelem) szövegek ezen a nyelven, amelyet be egy számítógépbe, és elektronikus formában tárolt, alkalmas keresési e a lexikai, grammatikai, stilisztikai egység és érdekes eseményekről, hogy a felhasználó számára.
Nemzeti Corps - a testület, hogy a lehető legteljesebb tükrözi a szókincs és a nyelvtan a nyelvet. Ez a nemzeti Corpus az orosz irodalmi nyelv tükrözi a szavak használatát, kifejezéseket, nyelvtani mondatok orosz irodalmi nyelv, mivel a 20. század közepén. és eddig. Teljesség a ház érhető el, ha ennek hiánya szavakat, kifejezéseket, nyelvtani szerkezetet, többé-kevésbé fenntartható kifejezés azt jelenti, hogy ezek az egységek, illetve jelenségek:
egy hiba, deviáns használatra;
Ezek anakronisztikus, nyilvánvalóan elavult diskurzus;
nem hasonlítható (amely még nem lépett be az orosz nyelv)
Célok és célkitűzések a ház:
szolgálhat, mint egy megbízható tényszerű anyag összeállításához szótárak, nyelvtanok, tankönyvek, segédkönyvek;
igazolását lehetővé tevő nyelvi hipotézisek a legreprezentatívabb anyag;
referenciaként szolgálhat eszközként ahhoz, hogy tisztázzuk a modern orosz irodalmi diskurzus, azaz hatékony asszisztens mindazok számára, akik dolgozni szavak (nyelvészek, irodalmárok, újságírók, írók, fordítók, tanárok az orosz nyelv és mások.);
alapjául szolgálhat a számítógépes modellezés beszéd aktivitást.
Keresés a Nemzeti testület az orosz irodalmi nyelv, melyet egy speciális program, amely lehetővé teszi, hogy:
kimutatására bármely adott szót (szó formájában) minden vagy kifejezetten megengedett szövegek;
Szükség esetén használja a statisztikai beszéd (szóalak), általában vagy az egyes szövegek kontextusban, stb.;
set konkordanciák - szavak és kifejezések, együtt használják egy adott szó (word képez kifejezés);
megtudja a statisztikai jellemzői szókincs és a nyelvtan a nyelv (például beállítani, hogy hányszor a Lev Tolsztoj szövegei csatlakozott a hadtest, a szó nő a tárgyeset);
Alapján a hadtest létrehozott (frekvencia) szótár szóalakok az orosz nyelvet. Kivétel nélkül minden szóalakok a Corps, és a szótár vannak ellátva egy sor morfológiai jellemzőket, ami morfológiai jelölési szótár és szöveg.
Morfológiai fogantyú - egy alom szóalak szöveget vagy egy szótár, amely jelzi, hogy a megfelelő nyelvtani (alaktani) jellemzése szóalakok, pl sg. azaz „Egyes számú”. Minden morfológiai jellemzőket formájában 2-4-betűs rövidítéseket, amelyet a megfelelő feltételeket az angol. Szóalakokra tartozó ez a része a beszéd, egy sor deszkriptorok jellemzésére alkalmazott a szó forma több állandó összetételű. Például, bár az ige jelen / jövő idejű nincs formában a fajta, amikor fel az alom „0” a megfelelő helyzetben a leíró és a „0” igék múlt időben kerül a pozíciója alom „arca”. Használata olyan karaktersor megfelelő jellemzőket, mint mindig ugyanaz. Ha a leíró nem kompatibilis ezzel a wordform az álláspont helyébe a „nulla” lineáris listát leírásait.
Morfológiai jelölés jelentése minden szó forrásmegjelölés (mindegyik szó formájában), mind a szótárban, és a szöveg meg a morfológiai jellemzőket. Morfológiailag azonosak szóalakokra rendelkeznek azonos készlet morfológiai leírók. A kifejezés, hogy bevezesse a szintaktikai jelölést.
Syntax jelölés - tükrözi szintaktikai szerkezete a mondat a szövegeket, például tulajdonítva minden mondat vagy szó formájában funkciójuk szempontjából szintaktikai kiválasztott szintaktikai elmélet (például 1. actant 2. actant stb névleges szóalakok és kiegészítők) .
Helyezett frekvencia szóalakok - egy speciális kódot, amely úgy tűnik, a szótárban minden szóalak, jelezve a használati gyakoriság a szóalakok szövegek Corps.
National Corpus az orosz irodalmi nyelv úgy alakították ki, elektronikus úton történő benyújtása tömb morfológiailag annotált szövegek orosz irodalmi nyelv.
A jelenléte a Nemzeti Testület irodalmi orosz nyelv - előfeltétele az új akadémiai nyelvtan és tudományos szókincs az orosz nyelv, ami alapjául szolgálhat a fejlődő családi nyelvtanok és szótárak a helyzetben, beleértve az iskola, valamint a különböző kézikönyvek és kézikönyvek. National Corpus az orosz irodalmi nyelv eszközként szolgálnak a kutatók a területen dolgozók a nyelvtan, lexikográfia, alkalmazott nyelvészet, tipológia a felvételét az orosz nyelv, mint egy tárgy a tanulmány. Ház is értékes információforrás a média szakemberek és azok, akiknek a szakmai tevékenység megköveteli a „nyelvi támogatás”.