Theme (subject) kereső
Theme (subject) a keresést. Alapjai.
A nemzetközi gyakorlatban létrehozását információs rendszerek, beleértve - a könyvtár, keressen témák és tárgyak kiosztott egy külön faj, amely lényegében a szemantikus keresés, vagy pontosabban, a keresést a szöveges tartalom. Ugyanakkor világos különbséget a fogalmak a „téma” és „tárgy” keresés nem létezik.
A feladat a tematikus keresés digitális könyvtárak (DL) eltér a létrehozását az elektronikus katalógusok (EC) nem olyan alapvetően, úgy tűnik, hogy sok, különösen, mivel a keresésének DL többnyire alapján az azonos bibliográfiai adatok (KB) az EK vagy a megfelelő által a tartalmi metaadatok, strukturált más módon (pl segítségével szöveges XML jelölőnyelv, vagy HTML). Néha azonban, hozzáadjuk a bibliográfiai adatokat, hogy néhány további része a dokumentumnak (pl tartalomjegyzék).
Az elméleti magyarázat, amit szabad kulcsszavas keresés (COP) az EK szerint vagy teljes szövegek elektronikus dokumentumok nem nyújtanak magas teljességét mutatók követi a megváltoztathatatlan törvényei nyelvi kommunikáció:
Technológiailag tematikus keresésének digitális könyvtárak (DL) hajtják végre:
- hagyományos elektronikus katalógusok EB források felhasználásával fogadta őket;
- A metaadatok bemutatott nem formájában rekordok EC (XML, HTML - kód);
- A teljes szövegű dokumentumok nyelvi processzorok, „tudásbázisok” és nélkülük;
- apránként teljes szöveg (például, fejezetek, összefoglalók, kommentárok, a legtöbb információt szakaszok).
Teljesség és pontosság szempontjából információszerzés függ kidolgozása a nyelvi eszközök a rendszer, függetlenül attól, hogy az eljárás végrehajtása érdekében.
Jó eredményeket a statisztikai szöveg feldolgozási technikák, a használata jelentőségének értékelésére a kifejezéseket a szövegben rangsor őket szerint néhány mutató „súlyát”. Azonban a nagy tömbök teljes szöveges adatok minőségének ellenőrzése ezen alapok rendkívül nehéz lesz támaszkodni néhány valószínűségi értékelése találatokat.
Követelményeinek végrehajtását a téma jellemzőit (subject) kereső segítségével különböző információkereső nyelvek (IRL) - mesterséges nyelvek, amelyeket kifejezetten tájékoztatási gépi feldolgozásra és visszakeresése ezt az információt az AIS.
Természetesen az adatelemek alá keresésének automatizált információs rendszer kapják címkeformátumból vagy kijelölés szöveget.