Nemzeti testület a magyar nyelv

Nemzeti testület a magyar nyelv


Az oldalon ruscorpora.ru vagy corpora.yandex.ru feltöltött képviselő jelölő ház modern magyar nyelven, több mint 120 millió. Szavak. A ház célja, hogy bárki érdeklődő a különböző kapcsolatos kérdéseket a magyar nyelv: a hivatásos nyelvészek, nyelvtanárok, a tanulók és diákok, külföldiek a magyar nyelv tanulása.

Mi ház?

A nemzeti testület által létrehozott nyelvészek (szakemberek az úgynevezett korpusznyelvészeti, gyors tempójú modern nyelvészet) kutatási és a nyelvtanulás. A legtöbb nagy világnyelven már rendelkezik saját nemzeti szervezet (amely szintjében különböznek a teljesség és a tudományos szöveget feldolgozás). Elismert minta, különösen a British National Corpus (BNC) :. Ő elsősorban számos más modern épületek. Között a szláv nyelvek épületek áll a Cseh Nemzeti Corpus. létre a prágai Károly Egyetemen.

Nemzeti ház két fontos jellemzőjét. Először is, ez jellemzi a reprezentatív, kiegyensúlyozott és szöveges összetételét. Ez azt jelenti, hogy a szervezet minden lehetséges típusú írásbeli és szóbeli szövegek benyújtott nyelvén (art különböző műfajok, publicisztikai, tudományos, tudományos, üzleti, köznapi, nyelvjárási, stb), és hogy ezek a szövegek testrész amennyire csak lehetséges, a való részesedésük arányában nyelvén az érintett időszakban. Meg kell jegyezni, hogy jól reprezentálja csak akkor lehet elérni, amely jelentős mennyiségű test (tízes és több száz millió token). A tervezett kötet megalkotói Nemzeti testület a magyar nyelv - 200 millió szó ..

A gazdagabb és változatosabb elrendezés, annál nagyobb a tudományos és oktatási értéke a ház. Az országos szervezet a magyar nyelvet jelenleg használják négyféle jelölés: metatext, morfológiai és szemantikai akcentussal; A közeljövőben bevezetése a jelölő szintaxis. A jelölési rendszer folyamatosan javult.
^

Miért van szükség a nemzeti szervezet?

Razrabatyaemy National Corpus magyar nyelv fedezné főként az időszak elejétől a XIX az elején a XXI század: ebben az időszakban az, hogy a nyelv a korábbi korok, és a modern, a különböző társadalmi-nyelvi változatok - irodalmi, köznyelvi, népi, részben nyelvjárást. Az alváz tartalmazza az eredeti (nem transzlálódó) irodalmi mű (próza és a dráma, a továbbiakban is a költészet), amelynek kulturális jelentősége, valamint az érdeklődés szempontjából nyelvet. De a Nemzeti testület semmilyen módon nem az egyetlen szakirodalom nyelvet. Amellett, hogy az irodalmi szövegek a szervezetben nagy mennyiségben tartalmaznak más példákat írott (és a jelenlegi szakaszban - és beszélt) nyelv: memoárok, esszék, újságírás, ismeretterjesztő és tudományos irodalomban, nyilvános beszédet, magánlevelezés, naplók, dokumentumok és így tovább. n.
^

Az összetétel és a szerkezet a burkolatok


A National Corpus magyar nyelv szerint Megfogalmazóit fogják építeni elsősorban szövegeket ábrázoló modern magyar irodalmi nyelv (a kezdetektől a XIX.), De a szövegek, hogy képviselje a régi magyar nyelvben (XI-XIV században.) És nem irodalmi formák a modern magyar nyelv: köznyelvi, népi, nyelvjárást.

Szövegek képviselő a modern magyar irodalmi nyelv, viszont két széles alkorpusz: korai corpus (az elején a XIX - XX közepén század) és a test a modern szövegek (középső XX - az elején a XXI század).

Jelenleg csak a test a modern szövegek felkerül az oldalon (a második felében a XX - elején XXI században.); elhelyezése egyéb szövegek a tervek során a további munkához.

Ház modern szövegeket. Corpus szövegek közepén XX - elején XXI század alkotja több épület, egymástól eltérő milyen típusú szövegek képviselnek és milyen módszereket használt jelzést őket.

Ház a párhuzamos szövegek. Egy speciális típusú lakás az úgynevezett párhuzamos testület, amelyben a szöveg orosz fordítás az egyező szöveget más nyelvre, vagy éppen ellenkezőleg, a szöveg idegen nyelven van leképezve a magyar nyelvű fordítás. Egységek közötti az eredeti és a lefordított szöveget (általában - mondatok között) egy meghatározott különleges eljárás megfelelő; Ezt a folyamatot nevezik igazítás és a szöveg, illetve egy vonalba.

Párhuzamosnak a szervezet egyik fontos kutatási eszköz (beleértve a kutatást az elmélet és a gyakorlat a fordítás); azt is fel lehet használni a tanítás magyar és idegen nyelven.

Jelenleg a honlap a Nemzeti Corps helyezzük egy kis rész párhuzamosan az orosz-angol korpusz.
^

szöveg lehetőségek

Csoport tényező érinti a célokat a szöveg és annak hatása a közönség. A paraméterek a közönség, amelyek jelentős hatást gyakorolnak a szövegben tulajdonított annak mérete, közelsége a beszélő és a hallgatóság korlátozások nem, életkor és iskolai végzettség a közönség. A méret a közönség van osztva nyilvános (több mint 50 olvasók / hallgatók, és alosztályok száz, ezer, millió) és a magán, viszont vannak osztva a személyes (2 tag), kis csoportban (maximum 5), egy csoport közepes méretű (legfeljebb 20) és a szalag. Közelsége a paraméter a legtöbb esetben a célközönség személytelenítik (azaz nem ismert, hogy a hangszóró). Ha a hangszóró / író képes leírni minden résztvevő kommunikáció, az közelségét minősítettük: jó személyes tudás, személyes tudás, nincs személyes ismeretség.

Építésénél a ház mélysége kódoló tartományt. Az érintett szöveget, nem túl fontos, mert a szervezet nem egyetemes enciklopédia. Ezen felül, az általános besorolását, mint ETO, ritkán alkalmazzák a szöveget, és még kevésbé alkalmazható a beszélt nyelv, a szöveg hatással lehet (és, mint általában, érzelem) több területen egyszerre. Az építőiparban a ház is van egy durva osztályozás, kiosztja, például a természet- és társadalomtudományok, a politika és a gazdaság, a művészet és szabadidő, stb
^

Statisztikák Hull

I. megoszlása ​​szövegek és más típusú metapriznakam

Kapcsolódó cikkek