Miért van szükség a nemzeti lakóingatlan

Hogy van az országos szervezetben?

Orosz Nemzeti Corpus fogalom elsősorban az időszak közepén a XVIII elején a XXI század: ebben az időszakban az, hogy a nyelv a korábbi korok, és a modern, a különböző társadalmi-nyelvi változatok - irodalmi, köznyelvi, népi, részben nyelvjárást. Az alváz tartalmazza az eredeti (nem transzlálódó) irodalmi mű (próza és a dráma, a továbbiakban is a költészet), amelynek kulturális jelentősége, valamint az érdeklődés szempontjából nyelvet. De a Nemzeti testület semmilyen módon nem az egyetlen szakirodalom nyelvet. Amellett, hogy az irodalmi szövegek a szervezetben nagy mennyiségben tartalmaznak más példákat írott (és a jelenlegi szakaszban - és beszélt) nyelv: memoárok, esszék, újságírás, ismeretterjesztő és tudományos irodalomban, nyilvános beszédet, magánlevelezés, naplók, dokumentumok és így tovább. n.

Orosz Nemzeti Corpus jelenleg tartalmazza a következő alkorpusz:

Mélyen annotált korpusz. amelyben a teljes morfológiai és szintaktikai szerkezete (Függőségi fa) épül minden egyes javaslatot;

Orosz-angol párhuzamos korpusz. ahol megtalálható az összes fordítás bizonyos orosz vagy angol szavak és kifejezések;

ház nyelvjárás szövegeket. beleértve a rekord a nyelvjárási beszéd különböző régióinak Oroszországból megőrzése a nyelvtani jellemzői; Van egy speciális kereső, figyelembe véve a morfológia a nyelvjárás;

teste költői szövegek. amely lehet keresni nemcsak a lexikai és grammatikai, hanem a konkrét jellemzőit a sor (search bizonyos kombinációkban szonettet epigrammáit, egy verset írt amphibrach, egy bizonyos típusú rím, stb ...);

képzés alakulat az orosz nyelv - esetében a pontosítás, jelölés, amely középpontjában a tananyag az orosz nyelv;

Minden szó és a szöveg Corpus tulajdonított nyelvi jegyzet alapján egy speciális szabvány kifejlesztett részvételével vezető orosz szakemberek.

Szerint a RAS levelező tagja AM Moldovan, az Intézet igazgatója az orosz nyelv. VV Vinogradov Tudományos Akadémia, „a teremtés és az Orosz Nemzeti Corpus az a feladata, valóban országos jelentőségű, mint a legtöbb nagy világnyelven már megvan a nemzeti szervek szövegeket. A megoldás erre a problémára hiánypótló a hazai nyelvészeti és fordítási tanulmányok és tanítása az orosz nyelv minőségileg új feltételeket. Túlzás nélkül elmondható, hogy az Advent a hadtest az első alkalom, hogy az anyagi alapot objektív és megbízható ítéletet a jelenlegi állapot és a fejlődés útjának az orosz nyelvet. "

A ház célja, hogy bárki érdekelt kapcsolatos kérdések az orosz nyelv: hivatásos nyelvészek, nyelvtanárok, a tanulók és diákok, külföldiek tanul orosz nyelvet.

„Örömünkre szolgál, hogy részt vettek a projektben, - mondja Ilja Segalovich, technikai igazgatója Yandex. - nyelvtanilag annotált korpusz nem csak egy módja annak, hogy megtanulják a nyelvet, hanem jelentős társadalmi eszköz létrehozására és testreszabására szoftver, dolgozó orosz szövegeket. "

Ezen az oldalon lévő National Corpus az orosz irodalmi nyelv fogant, mint egy univerzális eszköz, amely hatékonyabb működését mindazok részt vesznek a tevékenysége során a modern orosz irodalmi nyelv, vagy csak érdekli a feltétel és működtetése a nyelvet. A burkolat csatlakoznia kell a család meglévő nemzeti szervezetek más nyelvek - mint például a British National Corpus, National American Corpus, Tresor de la langue francaise et al.

Nyelv Corpus - gyűjteménye egy bizonyos módon kiválasztott (támogatott filológiai szakértelem) szövegek ezen a nyelven, amelyet be egy számítógépbe, és elektronikus formában tárolt, alkalmas keresési e a lexikai, grammatikai, stilisztikai egység és érdekes eseményekről, hogy a felhasználó számára.

Nemzeti Corps - a testület, hogy a lehető legteljesebb tükrözi a szókincs és a nyelvtan a nyelvet. Ez a nemzeti Corpus az orosz irodalmi nyelv tükrözi a szavak használatát, kifejezéseket, nyelvtani mondatok orosz irodalmi nyelv, mivel a 20. század közepén. és eddig. Teljesség a ház érhető el, ha ennek hiánya szavakat, kifejezéseket, nyelvtani szerkezetet, többé-kevésbé fenntartható kifejezés azt jelenti, hogy ezek az egységek, illetve jelenségek:

egy hiba, deviáns használatra;

Ezek anakronisztikus, nyilvánvalóan elavult diskurzus;

nem hasonlítható (amely még nem lépett be az orosz nyelv)

Célok és célkitűzések a ház:

szolgálhat, mint egy megbízható tényszerű anyag összeállításához szótárak, nyelvtanok, tankönyvek, segédkönyvek;

igazolását lehetővé tevő nyelvi hipotézisek a legreprezentatívabb anyag;

referenciaként szolgálhat eszközként ahhoz, hogy tisztázzuk a modern orosz irodalmi diskurzus, azaz hatékony asszisztens mindazok számára, akik dolgozni szavak (nyelvészek, irodalmárok, újságírók, írók, fordítók, tanárok az orosz nyelv és mások.);

alapjául szolgálhat a számítógépes modellezés beszéd aktivitást.

Keresés a Nemzeti testület az orosz irodalmi nyelv, melyet egy speciális program, amely lehetővé teszi, hogy:

kimutatására bármely adott szót (szó formájában) minden vagy kifejezetten megengedett szövegek;

Szükség esetén használja a statisztikai beszéd (szóalak), általában vagy az egyes szövegek kontextusban, stb.;

set konkordanciák - szavak és kifejezések, együtt használják egy adott szó (word képez kifejezés);

megtudja a statisztikai jellemzői szókincs és a nyelvtan a nyelv (például beállítani, hogy hányszor a Lev Tolsztoj szövegei csatlakozott a hadtest, a szó nő a tárgyeset);

Alapján a hadtest létrehozott (frekvencia) szótár szóalakok az orosz nyelvet. Kivétel nélkül minden szóalakok a Corps, és a szótár vannak ellátva egy sor morfológiai jellemzőket, ami morfológiai jelölési szótár és szöveg.

Morfológiai fogantyú - egy alom szóalak szöveget vagy egy szótár, amely jelzi, hogy a megfelelő nyelvtani (alaktani) jellemzése szóalakok, pl sg. azaz „Egyes számú”. Minden morfológiai jellemzőket formájában 2-4-betűs rövidítéseket, amelyet a megfelelő feltételeket az angol. Szóalakokra tartozó ez a része a beszéd, egy sor deszkriptorok jellemzésére alkalmazott a szó forma több állandó összetételű. Például, bár az ige jelen / jövő idejű nincs formában a fajta, amikor fel az alom „0” a megfelelő helyzetben a leíró és a „0” igék múlt időben kerül a pozíciója alom „arca”. Használata olyan karaktersor megfelelő jellemzőket, mint mindig ugyanaz. Ha a leíró nem kompatibilis ezzel a wordform az álláspont helyébe a „nulla” lineáris listát leírásait.

Morfológiai jelölés jelentése minden szó forrásmegjelölés (mindegyik szó formájában), mind a szótárban, és a szöveg meg a morfológiai jellemzőket. Morfológiailag azonosak szóalakokra rendelkeznek azonos készlet morfológiai leírók. A kifejezés, hogy bevezesse a szintaktikai jelölést.

Syntax jelölés - tükrözi szintaktikai szerkezete a mondat a szövegeket, például tulajdonítva minden mondat vagy szó formájában funkciójuk szempontjából szintaktikai kiválasztott szintaktikai elmélet (például 1. actant 2. actant stb névleges szóalakok és kiegészítők) .

Helyezett frekvencia szóalakok - egy speciális kódot, amely úgy tűnik, a szótárban minden szóalak, jelezve a használati gyakoriság a szóalakok szövegek Corps.

National Corpus az orosz irodalmi nyelv úgy alakították ki, elektronikus úton történő benyújtása tömb morfológiailag annotált szövegek orosz irodalmi nyelv.

A jelenléte a Nemzeti Testület irodalmi orosz nyelv - előfeltétele az új akadémiai nyelvtan és tudományos szókincs az orosz nyelv, ami alapjául szolgálhat a fejlődő családi nyelvtanok és szótárak a helyzetben, beleértve az iskola, valamint a különböző kézikönyvek és kézikönyvek. National Corpus az orosz irodalmi nyelv eszközként szolgálnak a kutatók a területen dolgozók a nyelvtan, lexikográfia, alkalmazott nyelvészet, tipológia a felvételét az orosz nyelv, mint egy tárgy a tanulmány. Ház is értékes információforrás a média szakemberek és azok, akiknek a szakmai tevékenység megköveteli a „nyelvi támogatás”.

Kapcsolódó cikkek