Dokumentumfilm adatbázis - online prezentáció
Fegyelem: „adatbázisok”
Specialty: №08080165
„Alkalmazott Informatikai (a gazdaságban)”
dokumentumfilm
adatbázis
Informatikai Intézet, az innováció és az üzleti rendszerek
Információs Rendszerek Tanszék és Alkalmazott
Informatika
Adjunktus O. Bogdanova
alapfogalmak
Mivel az információk nem mindig formájában bemutatva
strukturált adatok, szükség van
szervezet az adatok, kivéve tényszerű.
Információs rendszerek a dokumentumok tárolásához
különböző formátumokat úgynevezett dokumentumfilm
(DIPS) dokumentációs rendszerek.
alapfogalmak
Dokumentumfilm bázis adattípust lehet
szervezett:
• a tároló az eredeti dokumentum (teljes szöveg);
(Bibliográfiai, absztrakt)
• Nincs dokumentumok tárolása (DB-mutatók).
alapfogalmak
Információ keresése az ilyen rendszerek
dokumentumok listáját tartalmazó válaszként
felhasználó kérésére. vagy információt dokumentumok
Az információ jelentése felhasználói kérés
egy bizonyos értéket a megkövetelt információkat
adott időpontban, és kifejezett
természetes nyelv.
alapfogalmak
Helytállósága - megfelelő szemantikai tartalom
Dokumentum információ a felhasználó igényeinek.
Relevancia -, hogy az a dokumentum tartalma
információ kérés.
alapfogalmak
A hivatalos információk bemutatása
tartalomra vonatkozó kérelemre - a keresés utasítás (PP)
A hivatalos képviselete az alapinformációk
a dokumentum tartalma - a keresési kép
dokumentum (AML)
A szabályrendszer, amely meghatározza, milyen mértékben szemantikai
UNDER közelsége és PP - kritérium értelmében
levelezés
folyamat automatizálása
érdeklődés
keresés
kép
=
nincs
üzenet
felderítő
végzés
kritérium
jelentés
levelezés
igen
funkcionális szerkezet
érdeklődés
alrendszer
feldolgozás
alrendszer
bemeneti és
a regisztráció
keresés
kép
felderítő
végzés
alrendszer
kutató
keresés
kép
KCC
szótár
index
alrendszer
bolt
bázis
adat
funkcionális szerkezet
A tároló alrendszer sosem egyszerű üzletek
gyűjteménye tények, elosztott katalógusok, mint
okozhat a probléma megtalálása és információk
hatékony felhasználása lemezterület.
Ez az alrendszer mindig használ A kompakt és
Ez jelenti a sor DBMS
azt jelenti, archiválás, stb
funkcionális szerkezet
a feldolgozási alrendszer jön létre minden dokumentumból
keressen egy képet, amely menti az index.
A logikai index egy asztalhoz, ahol a sorok
Megfelelő dokumentumok és információk oszlopok
szerepelt.
funkcionális szerkezet
kereső alrendszer, hogy megtaláljuk az index
Dokumentum keresés Kép kielégítő keresés
vényköteles szempontjából a kritérium jelentését
megfelelést.
Azonosítói talált megfelelő dokumentumokat
kimenet a kereső alrendszer továbbítjuk a bemeneti
Tárolás alrendszerrel, amely kiadott tényleges
dokumentumokat a felhasználó számára.
Információkereső nyelvek
Információkereső nyelv úgynevezett
szaknyelv leírására
szemantikai tartalma által kapott üzeneteket a rendszer
Annak érdekében, hogy a szekvenciális keresést.
A két fő típusa van:
Besorolás nyelv;
leíró nyelv
• Nyelvtan és anélkül nyelvtan
• ellenőrzött szókészlet és ingyenes
A beérkező szöveges
információ
Az eljárás, melynek során a dokumentum természetes nyelv
információkereső nyelv az úgynevezett
rubritcirovanie vagy indexelés.
automatikus indexelés
automatikus
indexelés
dokumentumok
képes
alapja egy egyszerű, egy szó vagy több szóból
összetett
feltételei
(Mondatok).
feltételek kifejezések
több
értelmes, van egy nagyobb megkülönböztető erejét.
A beérkező szöveges
információ
Az eljárás, melynek során a dokumentum természetes nyelv
információkereső nyelv az úgynevezett
rubritcirovanie vagy indexelés.
Az izolált rubritcirovanie dokumentum 2 fő
megközelítés:
1. rubritcirovanie ismeretén alapul;
2. rubritcirovanie alapú képzés
példák.
A beérkező szöveges
információ
Két alapmodellje tudásreprezentációs:
1. Egy szemantikai hálózat (SS)
Thesaurus - hierarchikus hálózat fogalmak és összefüggések között
őket.
2. A termelési modell (PM)
Kiosztani 2 csoportok:
statikus rubritcirovanie
Neurális hálózat módszereket
A beérkező szöveges
információ
Statisztikai rubritcirovanie - meghatározása fokú
megfelelés és dokumentum terminológia portré
terminológiai portré alapján oszlopon
összehasonlítjuk a statisztikai jellemzőit tárgyak
Neurális hálózat technikákat használnak rubritcirovanie
neurális hálózat, mint a képzési az osztályozót.
Van válogatott szövegek, amelyek mindegyike jelölve
releváns vagy irreleváns az oszlopot.
Alapvető keresés modellek
• Logikai modell egy sor dokumentumot
megjelenő kifejezések az index, amelyek mindegyike
tekinteni, mint egy logikai
• A modell páratlan készlet lehetővé teszi, hogy a részleges
a periódusos rendszer a beállított
• Térvektor tekintve összessége
A dokumentumokon vektorhalmaz térben kerül meghatározásra
n normalizált távú vektorok
• A valószínűségi modell meghatározza annak a valószínűségét vhozheniya
távú dokumentumban