Jellemzői a végrehajtás dokumentum tárolás és visszakeresés mechanizmusok

Követelmények rendszerek összpontosító takarékos és hatékony feldolgozását strukturálatlan vagy félig strukturált adat jött a másik az 1970-es, külön ága a program adatbázis-kezelő rendszerek, amelyek alapján okirati információs rendszerek.

Azonban elméleti kutatást információszerzés dokumentumok, megkezdődött a 1950-es - 1960-as években, sajnos, még nem kapott ilyen szigorú, teljes és egyúttal technológiailag megvalósítható adatok és a feldolgozási modellek, mint a relációs modell ténybeli rendszereket. Nem kapott szabványosítás és számos kísérlet, hogy hozzon létre egy úgynevezett univerzális információkereső nyelv formális leírása a szemantikai dokumentumok tartalmának és lekérdezések őket.

Jelenleg információszerzés rendszereket széles körben használják az elektronikus jogrendszerek, a könyvtár, az internet és egyéb rendszerek.

Bevezetéssel és 1, 2, 3, 4 íródnak AT Tyazhevym 5. fejezet - TT Osipova, 6. fejezet, 7, 8 - RR Fokine, 9. fejezet, és kérdéseket az önuralmat - MA Abissovoy.

1. fejezet típusai információkereső rendszerek. ÁLTALÁNOS JELLEMZŐK

Adatkezelő rendszer (IRS) - információs rendszer (IS), egy példányt az egyedi adatok elemeket és eszközöket fejleszteni a keresési és kiválasztási.

IPS modul integrálható szinte minden modern szoftver.

Között a nagyszámú fájlok a lemezen, akkor megtalálja a szükséges fájlokat.

próbálja megtalálni a lemezen d: Word fájlok (* .doc, * .rtf), amelyek kimutatások, feljegyzések, magyarázó, IPS anyagokat.

A hosszú szöveg (a kivonatok, persze, szakdolgozat), megtalálja a megfelelő hely számunkra a szövegben, ha arra gondolunk, egy szó ezen a helyen. A Can összes előfordulását a szövegben egy szó helyébe egy másik szót.

találni néhány Word fájlt (* .doc, * .rtf), és ezt a fájlt, hogy csere, amit azok egyes 10 szó szinonimája.

IPS CD-DVD LEMEZ

van egy lézerlemezjátszóhoz és telepítésével kapcsolatos releváns IRS a számítógépen. Köztük például:

- Felülnézeti Szentpétervár

- Felülnézeti leningrádi régióban

- Hogy jött tesztelni

- Hogyan juthat el egy munkát

- A kiválasztás és a titkok digitális fényképezőgépek

- Kiválasztása és titkok síléc és a snowboard

Tegyük az IRS az egyik a számítógépek.

A legerősebb IPS elérhető az interneten.

A keresőmotorok Rambler (www.rambler.ru), Yandex (www.yandex.ru) stb főleg, hogy megtalálják a megfelelő helyeket. Ezek az intelligens IPS. Ha azt kérdezzük, hogy megtalálják oldalak a „pilot”, akkor is megtalálható oldalak a „pilot”, és minden esetben.

A leghíresebb helyek (társaságok, könyvtárak, történelem, stb) IRS információt keresni ezen az oldalon. Íme néhány példa:

Ábra 1.1. Szerinti besorolás IRS egyes adatelemek

Szerint a típusát egység cellák vannak osztva az IRS adatokat, és tényleges dokumentumfilmek (1.1 ábra).

Factographic IPA - információs rendszerek, amelyekben egyetlen adat elemnek külön szemantikai értéke üzenet. kialakítva egy véges halmaza attribútummezőkkel.

Például, az Access belépés állhat a következő területeken (lásd 1.1 táblázat).

Táblázat 1.1. rekord Access

Működés ténybeli IRS megkívánja akár kezdetben strukturált adatok (érzékelő jelentéseket a folyamatirányító rendszerek, pénzügyi elszámolás tömbök IC-k, stb), vagy előre strukturálása adatokat. Ebből származik ténybeli hiányosságait IP:

- Gyakran strukturálása adatokat igényel sok fölött, beleértve a és szervezési költségek, ami a lényeges információkhoz,

- kivonat a szöveg formalizált pozíciók behelyezésre tényszerű IC hibákhoz vezethet és a veszteség egy részét az információt, hogy az eredeti forrás áll rendelkezésre, de hiánya miatt az adatbázis megfelelő adatelemek nem lehet tükröződik.

Nemrég kapott prioritás dokumentumfilm IPS.

Dokumentumfilm IPA - információs rendszerek, az egység eleme van, amely kisebb strukturálatlan dokumentum elemei.

Általában ez a szöveges dokumentumok szövegfájlokká, bár az osztály strukturálatlan adatokat tartalmazó dokumentációt is hang- és grafikai fájlokat.

A fő cél a dokumentumfilm a felhalmozódása IP és a dokumentumok a felhasználót, hogy a tartalom, a megjelenés és egyéb részleteket. Eleget információs igényeit.

Az információs igényeket - tudatos megértése a különbség az egyéni tudás, meghatározva a különbség a szubjektív tevékenység tárgya, és a tudásszint erről a témáról, felhalmozott társadalomban.

Megjegyzés: hírek, a kereslet - azaz az információkat, amelyek szükségesek a felhasználó számára.

Helytállósága úgynevezett illő talált dokumentumok információkat a felhasználó igényeinek.

Megjegyzés: megtaláltam az információt, és visszakereső rendszer nem teljesen felel meg az igényeinek a felhasználó.

Jellemzői a végrehajtás dokumentum tárolás és visszakeresés mechanizmusok

Attól függően, hogy a konkrét végrehajtási dokumentum tárolási és visszakereső rendszer és dokumentációs keresők vannak osztva alapuló rendszerek indexelés és szemantikai navigációs rendszerek (1.2 ábra).

1.2 ábra. Típusú dokumentumfilm IPS függően az adott végrehajtási dokumentum tárolás és visszakeresés mechanizmusok

A szemantikailag-alapú navigációs rendszer helyezett dokumentumokat a tárolóban (bázis) felszerelt speciális eszközökkel navigatsionnymikonstruktsiyami. megfelelő szemantikai kapcsolatokat (referencia) a különféle dokumentumok, illetve az egyedi darabjai a dokumentumot. Az ilyen tervek végrehajtása bizonyos szemantikai (szemantikai) hálózat az adatbázisban dokumentumban. A keresés végrehajtása által kifejezetten a navigációt a szemantikai utalások dokumentumok között. Jelenleg ez a megközelítés végrehajtása hypertext IPA.

Indexelés - tartalmi leírást útján formalizált nyelv információkat.

Dokumentum keresés Image (AML) formalizált leírását a dokumentum index.

Keresés kép kérés (PAHO) az alapdokumentum a kifejeződése a felhasználó információs igények a média és a nyelv a keresési teret.

A rendszer alapján bizonyos kritériumok és módszerek keresek dokumentum, amely egyezik, vagy közel vannak a REF, és kiadja a megfelelő dokumentumokat.

Megjegyzés: Van egy széles skáláját információk - dokumentálja magukat. Van nehéz találni semmit. Gyűjtjük Index - egy kis információt könnyen visszakereshető. Ez indexelés. Példák: Kis információs (index) - a terület térképét. A sok információ - ez a nagyon területen. Kis információs (index) - egy tartalomjegyzék. A sok információ - ez a könyv is. Legyen egy könyvet a művészek. Tartalomjegyzék könnyű megtalálni információkat, amelyek az oldalak, például Shishkin. Ebben az esetben a dokumentumok - egy fejezet a könyvben, a keresési tér - ez egy tartalomjegyzéket, keresés képek dokumentumok (SOD) - a tartalomjegyzék. A fényképek keresésére (PAHO) - a szó Shishkin, keresünk az elem tartalmát a szót.

1.3 ábra. az index alapján a rendszer

Lényeges az illesztés talált dokumentumokat felhasználó kérésére.

Megjegyzés: A kérelmet pedig eltér a keresésnek kép (PAHO)? A kérelem megfogalmazása, és érthető az ember. Például: Érdekel a dokumentumokat az interneten, azt állítva, hogy az amerikaiak, hogy a hold - egy átverés. PAHO van kiszerelve úgy, hogy „megérti” a gép. Például egy sor kulcsszavak: hold repülés hoax amerikaiak. PAHO nem tudja teljes mértékben eleget tesz a kérésnek.

Kapcsolódó cikkek