adatbázis előadások

előző ◈ a következő

Bármilyen adatot lehet rendelni egy két típusa van: elsődleges (egyszerű), amelyek bemutatása határozza meg a számítógép-architektúra vagy komplex a felhasználó által létrehozott meghatározott feladatok elvégzésére.

Ezek az egyszerű típus - karakter, számok, stb elemek további aprítás, amely nincs értelme. Elemi adatszerkezetek keletkeznek (komplex típusú) adatok.

· Array (függvény a végső meghatározása régió) - egy egyszerű adatgyűjtés terméket egyik típusa, az operációs révén egy csoportja az adatok típusát. Egy különálló elem a tömb által adott index. A tömb lehet egydimenziós, kétdimenziós, stb Faj háromdimenziós tömbök változó hosszúságú szerkezetet típusú gyűrű, verem, kapcsolja, és kapcsolja a duplex.

· Record (Descartes-szorzat) - egy sor elemeit különböző típusú adatokat. A legegyszerűbb esetben rekord tartalmaz egy állandó elemeinek számát, amelyek úgynevezett mezőket. A gyűjtemény rekordok az azonos szerkezetű nevezik fájlt. (A fájl neve, mint egy sor adatok egy külső memória, például egy mágneses lemez). Rend. hogy képes legyen kivonat az egyes fájlok bejegyzések, minden rekord egy egyedi nevet vagy számot, amely arra szolgál, identitását és található egy külön mezőben. Ez az azonosító kulcsnak nevezik.

Egy ilyen adatszerkezet egy tömb vagy rekord take a számítógép memóriájában egy állandó térfogatú, ezért nevezik őket statikus szerkezetek. A statikus struktúra tartalmaz ezenkívül egy sor.

Ábra. 1.1. Osztályozása adattípusok

Megvizsgáltuk többféle struktúrák gyűjteménye adatelemek a tömb, egy fa, egy rekordot. Több összetett adattípus tartozhatnak azon struktúrák, mint az elemek. Például, a rögzítési elemek lehetnek egy tömb, verem, fa, stb

Van sokféle összetett adattípusok, de végzett tanulmányok nagy gyakorlati anyagot, azt mutatta, hogy köztük van néhány a leggyakoribb. Általános szerkezet is ismert adatok modellek. mert tükrözik a felhasználó megértése valós adatok.

Bármilyen adatmodell tartalmaznia kell három részből áll:

1. Az adatok szerkezete - írja a felhasználó szempontjából a az adatok megjelenítését.

2. A készlet megengedett műveleteket. végzett az adatstruktúra. Az adatok modell feltételezi, minimális, a jelenléte a adatok meghatározása nyelv (DDL), amely leírja a szerkezetét a tárolási és adatkezelési nyelvet (DML), amely adatok módosítása és visszakeresés működését.

3. Az integritási kényszerek - olyan mechanizmust való megfelelés fenntartása a tárgykörben alapján formálisan az ezeket a szabályokat.

A folyamat során a történelmi fejlődés, a következő adatokat modellt az adatbázisban:

Az utóbbi években ez egyre fontosabb objektum-orientált megközelítés az adatok bemutatása.

Kérdések az adatok ábrázolása szorosan kapcsolódik a műveletek, amelyek során ezek az adatok feldolgozása. Ilyen műveletek többek között: mintavétel, a változó a felvételi és kizárási adat. Középpontjában a mindezen műveletek hozzáférési művelet. amely nem tekinthető függetlenül a bemutatás módjától.

A keresési problémák azt feltételezzük, hogy az összes adatot a memóriában egy bizonyos identitás és beszélünk hozzáférést, azt jelenti, mindenekelőtt az adatokhoz való hozzáférés (az úgynevezett kulcs), amely egyedileg azonosítja a kapcsolódó adathalmaz.

Tegyük fel, hogy szükség van-e a hozzáférést egy fájlt tartalmazó sor azonos nyilvántartások, amelyek mindegyike egyedi értéket a kulcs mezőbe. A legegyszerűbb módja annak, hogy keresni - egymás megtekintheti az egyes rekordot a fájlt, amíg azt találtuk, hogy a kulcs értéke felel meg a keresési feltételeket. Nyilvánvaló, hogy ez a módszer hatékony, mert nincs bejegyzés sorrendjében a kulcs mezőbe. Válogató rekordok egy fájlt, és nem lehet alkalmazni, mert több időt vett igénybe, és el kell végezni minden hozzáadás után bejegyzést. Ezért a következőképpen kell eljárni - a kulcsokat a mutató a megfelelő bejegyzéseket a fájlt kell másolni egy másik szerkezet, amely lehetővé teszi, hogy gyorsan rendezni, és a keresési műveletek. Amikor az adatokhoz való hozzáférés elején ez szerkezet megfelel a legfontosabb értéket, majd tárolni azzal a mutató bejegyzést nyert köldökzsinórt.

Két osztály módszerek, amelyek megvalósítják az adatokhoz való hozzáférés kulcsfontosságú:

· Keresés technikák, fa,

1.2.1.Metody a fa keresés

Meghatározás: A fa egy véges halmaza, amely egy vagy több elem, az úgynevezett csomópontok, oly módon, hogy:

1.mezhdu csomópontok az arány a „forrás - generált”;

2. Csak egy csomópont nem rendelkező forrás csomópont. Felhívta a gyökér;

3. Minden csomópont a gyökér kivételével csak egy forrása; Minden egyes csomópont generált több csomópontot;

4.otnoshenie „forrás - generált” működik csak egy irányban, azaz, nincs leszármazottja egy csomópont nem lehet az őse is.

A szám által generált külön csomópont (száma részfák a gyökér) nevezzük fokával. Csomópont nulla fokos hívott végberendezés csomópont vagy levél. A maximális érték a fokozatok minden fa csomópontjait az úgynevezett mértéke a fa.

Ha a fa által generált csomópontok közötti azonos eredetű, nem elengedhetetlen azok sorrendjét, a fa az úgynevezett rendezett. A keresési probléma szinte mindig úgy rendezett fák.

Rendezett fa, amelynek mértéke legfeljebb 2 nevezzük bináris fa. A bináris fa használják, különösen, ha keres a memóriában. A keresési algoritmus: az első, a keresés érv összehasonlítjuk egy kulcsot a gyökér. Ha az argumentum megegyezik a kulcsot, a keresés befejeződött, ha nem ugyanaz, abban az esetben, ha az argumentum kisebb, mint a kulcs, a kutatás folytatódik a bal részfa, és abban az esetben, ha több kulcs - a jobb részfa. Szintjének növelése 1, ismételt összehasonlítás, figyelembe véve a jelenlegi csomópont a gyökér.

Példa: Tegyük fel, hogy adott egy listát a diákok, amely tartalmazza nevüket és GPA folyamatban van (lásd 1.1.). A hallgató nevét használjuk a kulcsot. Tegyük fel, hogy az összes rekordot van egy fix hosszúságú, akkor használd a rekordot, mint a mutató. egy fájlt írási offset ebben az esetben úgy számítjuk, mint ([nomer_zapisi] -1) * [dlina_zapisi]. Hagyja, hogy a keresési érv „Petrov”. 1.2 ábra mutatja, az egyik lehetséges erre sor bináris keresési fa és a keresési útvonal adatait.

Ábra. 1.2. Keresés bináris fa

Megjegyzendő, hogy ez használ a következő szabály összehasonlításával karakterlánc változó: úgy gondoljuk, hogy az érték a megfelelő jelkép annak sorszámát az ábécé. Ezért „és a” kevesebb, mint a „K” és „K” kevesebb, mint a „C”. Ha az aktuális karakter a hasonlítson húrok egyezik, a karakterek, mint a következő pozíciókban.

Bináris fák különösen hatékonyak az esetben, ha több billentyű nem ismert előre, vagy ha gyorsan változik beállítva. Nyilvánvaló, hogy ha egy váltakozó kulcscsomót Jobb, ha van egy kiegyensúlyozott fát.

Definíció: Egy bináris fa nevezzük kiegyensúlyozott (kiegyensúlyozott), ha a magassága a bal részfa minden egyes csomópont eltér a magassága a jobb részfa nem több, mint 1.

Ha keres adatokat a külső memória egy nagyon fontos probléma számának csökkentése adatmozgások a OVC RAM. Ezért ebben az esetben, mint a bináris fa lesz sokkal kedvezőbb elágazás fák - mint a magasságuk kisebb, akkor a keresés lesz szükség kevesebb hívást a külső memória. A legnagyobb alkalmazás ebben az esetben kapott B-fák (in - kiegyensúlyozott)

Meghatározás: A fa a rend n nevezett erősen elágazó fa fokú 2n + 1, az alábbi tulajdonságokkal:

Minden egyes csomópont, a gyökér kivételével, nem kevesebb, mint n, és kisebb, mint 2n kulcsokat.
A gyökér tartalmaz legalább egy, de legfeljebb 2n kulcsokat.
Minden levelek ugyanazon a szinten.
Minden közbenső csomópont két listát tartalmaz: az emelkedő rendezett listát a legfontosabb értékeket és a megfelelő listát mutatók (mutatók levélcsomópontokhoz lista offline).

Egy ilyen fa:

· Viszonylag könnyen lehet elhelyezni szekvenciális hozzáférés, mint mindenki hagy ugyanazon a szinten;

· Miután hozzáadása vagy módosítása a legfontosabb változások korlátozottak, mint általában, egy csomópont.

Ábra. 1.3.Sbalansirovannoe fa

A -fa, ahol a tényleges értékek tartalmazza csak a levelek (végső csomópontok), az úgynevezett B + - fa. A belső fa csomópontjait tartalmazza a nyomokat elválasztó, adjon meg egy sor kulcsfontosságú változások részfákat.

R -fa (R -fa) egy index struktúra térbeli adatokhoz való hozzáférés által kínált A. Guttman (University of California, Berkeley). R-tree végrehajtása lehetővé teszi tetszőleges műveleteket hozzátéve, törlése és adatvisszaszerzés nélkül az időszakos Újraindexelés.

Használnak az adatok elemzését, amelyek mindegyike egy egyedi azonosítót (tuple-azonosító). Minden végpont (levél) a fa bejegyzés tartalmaz egy típusa (I, tuple-azonosító). ahol - n dimenziós paralelepipedon tartalmazó mutatókat térbeli adatok (más néven minimális befoglaló téglalap MBR.), és mindegyik elem a tuple-azonosító tartalmaz egy felső és egy alsó korlátot a megfelelő mérete paralelepipedon.

Nem-levél csomópontok vonatkozó bejegyzéseket, a forma (I, childnode-pointer). Azt, ahol a legkisebb befoglaló doboz összes csomópont MBR, deriváltak ezt. Childnode-mutatót - egy mutatót a származó komponenseket.

Legyen M és m<= M/2 соответственно максимальное и мимимальное количество элементов, которое может быть размещено в узле. Тогда свойства R-дерева можно описать следующим образом:

· R-fa rendkívül kiegyensúlyozott fa, azaz minden levelek ugyanazon a szinten.

· A gyökér csomópont legalább két gyerek.

· Minden egyes cella (I, childnode-pointer) egy nemterminális csomópont I a lehető legkisebb parallelepipedon, vagyis Ez magában foglalja a származékok paralelepipedonok csomópont.

· Minden egyes végberendezés csomópont (levél) van a m m Index rekordok.

· Minden indexbejegyzés (I, tuple-azonosító) a végső csomópont I egy paralelepipedon, amely egy n-dimenziós objektum adatokat, ami azt jelzi, a tuple-azonosítót.

1.2.2.Heshirovanie

Akkordok adatbázis dump

Kapcsolódó cikkek

előző ◈ a következő