Theme (subject) kereső

Theme (subject) kereső

Theme (subject) a keresést. Alapjai.

A nemzetközi gyakorlatban létrehozását információs rendszerek, beleértve - a könyvtár, keressen témák és tárgyak kiosztott egy külön faj, amely lényegében a szemantikus keresés, vagy pontosabban, a keresést a szöveges tartalom. Ugyanakkor világos különbséget a fogalmak a „téma” és „tárgy” keresés nem létezik.

A feladat a tematikus keresés digitális könyvtárak (DL) eltér a létrehozását az elektronikus katalógusok (EC) nem olyan alapvetően, úgy tűnik, hogy sok, különösen, mivel a keresésének DL többnyire alapján az azonos bibliográfiai adatok (KB) az EK vagy a megfelelő által a tartalmi metaadatok, strukturált más módon (pl segítségével szöveges XML jelölőnyelv, vagy HTML). Néha azonban, hozzáadjuk a bibliográfiai adatokat, hogy néhány további része a dokumentumnak (pl tartalomjegyzék).

Az elméleti magyarázat, amit szabad kulcsszavas keresés (COP) az EK szerint vagy teljes szövegek elektronikus dokumentumok nem nyújtanak magas teljességét mutatók követi a megváltoztathatatlan törvényei nyelvi kommunikáció:

Technológiailag tematikus keresésének digitális könyvtárak (DL) hajtják végre:

  • hagyományos elektronikus katalógusok EB források felhasználásával fogadta őket;
  • A metaadatok bemutatott nem formájában rekordok EC (XML, HTML - kód);
  • A teljes szövegű dokumentumok nyelvi processzorok, „tudásbázisok” és nélkülük;
  • apránként teljes szöveg (például, fejezetek, összefoglalók, kommentárok, a legtöbb információt szakaszok).

Teljesség és pontosság szempontjából információszerzés függ kidolgozása a nyelvi eszközök a rendszer, függetlenül attól, hogy az eljárás végrehajtása érdekében.

Jó eredményeket a statisztikai szöveg feldolgozási technikák, a használata jelentőségének értékelésére a kifejezéseket a szövegben rangsor őket szerint néhány mutató „súlyát”. Azonban a nagy tömbök teljes szöveges adatok minőségének ellenőrzése ezen alapok rendkívül nehéz lesz támaszkodni néhány valószínűségi értékelése találatokat.

Követelményeinek végrehajtását a téma jellemzőit (subject) kereső segítségével különböző információkereső nyelvek (IRL) - mesterséges nyelvek, amelyeket kifejezetten tájékoztatási gépi feldolgozásra és visszakeresése ezt az információt az AIS.

Természetesen az adatelemek alá keresésének automatizált információs rendszer kapják címkeformátumból vagy kijelölés szöveget.

Kapcsolódó cikkek