Adatmodellek - stadopedia
Az adatbázisok elméletének alapfogalmai
Egy objektum egy olyan információs rendszer eleme, amelynek információja az adatbázisban tárolódik.
Az attribútum egy objektum tulajdonságainak információs megjelenítése. Minden objektumot jellemző tulajdonságok jellemzik.
A legfontosabb adatelem egy attribútum (vagy attribútumcsoport), amely lehetővé teszi a többi adatelem értékének meghatározását.
Az adatrekord (a rekord angol megfelelője) a kapcsolódó adatokhoz tartozó értékek gyűjteménye.
Az elsődleges kulcs egy olyan attribútum (vagy attribútumcsoport), amely egyedileg azonosítja az objektum minden egyes példányát (rekordot). A másodlagos kulcs egy olyan attribútum (vagy attribútumcsoport), amelynek értéke több rekordra (objektum példányokra) is megismételhető. Először is, másodlagos kulcsokat használnak a rekordkeresési műveletekben.
Az adatbázisban tárolt adatoknak bizonyos általános elveknek kell megfelelniük, amelyek közül elsősorban meg kell jegyezni:
• Az adatok integritása és következetessége, amelyet az adatok fizikai biztonságaként értelmeznek, és megakadályozza az adatok visszaélését, az értékek elfogadható kombinációinak megőrzését, a szerkezeti torzulástól és a jogosulatlan hozzáféréstől való védelmet;
• A minimális adat redundancia azt jelenti, hogy bármely adatelemet egyetlen formában tárolni kell az adatbázisban, elkerülve ezzel az elvégzett műveletek megkettőzését.
Az adatbázisban az adattárolás logikai felépítésének meghatározását meghatározó elvek egy csoportját adatmodellnek nevezik. Az adatbázis modelleket három összetevő határozza meg:
• elfogadható adatszervezet;
• elfogadható műveletek.
Az adatbázis-kezelő rendszerek elméletében három alapvető modellt különböztetünk meg: hierarchikus, hálózati és relációs.
A hierarchikus modell lehetővé teszi a hierarchikus fa struktúrával rendelkező adatbázisok létrehozását. Ez a szerkezet a páros linkek által létrehozott fa. A fa legfelsõ szintjén van egy csomópont, amelyet gyökérnek hívnak. Minden elemet alárendeltségi viszonyok kötnek össze, így bármelyik elem csak egy másik elemet tud betartani. A függőség e formáját kényelmesen képviseli
egy fa-szerű grafikon (olyan pontokból és nyilakból álló áramkör, amelyek kapcsolódnak, és nincsenek ciklusok). A hierarchikus adatbázis struktúrájának egyik példája a 3. ábrán látható. 2.1.A hierarchikus modell legfőbb előnye a valós világ hierarchikus struktúráinak leírása.
Egy hierarchikus modellen alapuló adatbázis-család tipikus képviselője az IBM Information Management System (IMS), amelynek első változata 1968-ban jelent meg.
A hálózati adatmodell koncepciója a C. Bachmann névhez kapcsolódik. Az adatkezelés hálózati megközelítése a hierarchia kiterjesztése. A hierarchikus struktúrákban a leszármazási rekordnak pontosan egy őse van; A hálózati adatszerkezetben a leszármazottnak lehet számú őse (2.2. Ábra). Ebben az elem bármely máshoz kapcsolható, korlátozás nélkül. A hálózati DB egy olyan rekordkészletből áll, amely megfelel a tartományobjektum minden egyes példányának és egy sor összeköttetésnek. Például a szervezetek projektjeiben a munkavállalók részvételére vonatkozó információk a hálózati adatbázisban (2.3. Ábra) mutathatók be. Ebben a példában a hálózati modell jól tükrözi azt a tényt, hogy különböző munkatársak vehetnek részt a projektben, ugyanakkor a munkavállaló különböző projektekben is részt vehet.Ábra. 2.3. Példa egy adatbázis hálózati struktúrájára
A hálózatba szerveződő adatkezelő rendszer egyik példája a Cullinet Software Inc. integrált adatbáziskezelő rendszere (IDMS). a 70-es évek közepén alakult ki. Nagyméretű számítógépeken történő használatra tervezték.
A hierarchikus vagy hálózati modelleken alapuló adatkezelési rendszerek előnyei közül azok nevezhetők tömörségüknek és rendszerint nagy sebességüknek, valamint a hiányosságok - nem általános jellegűek, nagyfokú függőség a konkrét adatoktól.
A relációs modell fogalmát először az EF Codd amerikai tudós munkáiban fogalmazták meg. Hol származik a második neve - a Codd modell.
A relációs modellben az objektumok és a köztük lévő kapcsolatok táblázatokkal vannak ábrázolva (2.4. Ábra). Formális definíciója az összefüggés alapvető fogalmát használja. Szigorúan a "relációs" kifejezés az angol viszonyról - a kapcsolatról származik.A relációs modell a relációs algebra fogalmának rendszerére támaszkodik, amelyek közül a legfontosabbak: táblázat, kapcsolat, húr, oszlop, elsődleges kulcs. A relációs adatbázis minden művelete a manipulációs táblákra korlátozódik. A táblázat sorokból és oszlopokból áll, és az adatbázisban egyedi név található. A táblázat tükrözi a valós világ objektum (entitás) típusát, és minden egyes vonal (tuple) egy adott objektum (2.5. Ábra). Például az "Osztály munkatársai" tábla tartalmaz információkat az osztály összes alkalmazottjától, minden sorát - egy adott alkalmazott attribútumainak értékkészletét. Egy adott attribútum értékeit a tartomány (tartomány) választja ki - az objektum minden lehetséges értékének halmaza. Az oszlopnévnek egyedinek kell lennie a táblázatban. Az oszlopok a táblázatban a nevük sorrendjében találhatók. Bármelyik táblázatnak legalább egy oszlopnak kell lennie. Az oszlopokkal ellentétben a sorokban nincsenek nevek. A táblázat következő sorrendje nincs meghatározva, és a szám nem logikusan korlátozott. Mivel a táblázatban lévő sorok nincsenek rendezve, lehetetlen kiválasztani a sorot pozíciója szerint - nincs köztük "első" és "utolsó".
Ábra. 2.5. Relációs adatbázis kapcsolat
Bármelyik asztalnak egy vagy több oszlopa van, amelyek értékei egyedileg azonosítják az egyes sorokat. Az ilyen oszlop (vagy oszlopok kombinációja) az elsődleges kulcs. Az "Osztály munkatársai" táblázatban az elsődleges kulcs a "Skip number" oszlop. A táblában nem lehet olyan sorok, amelyeknek ugyanaz az elsődleges kulcsértékük van. Ha a táblázat kielégíti ezt a követelményt, ezt relációnak nevezik.
A táblák összekapcsolását a relációs modellben idegen kulcsok támogatják. Az idegen kulcs egy olyan oszlop, amelynek értékei egyértelműen jellemzik a más reláció sorai által helyettesített entitást, vagyis meghatározzák az elsődleges kulcs értékét. Azt mondják, hogy az összefüggés, amelyben az idegen kulcs definiált, arra a megfelelő kapcsolatra utal, amelyben ugyanaz a tulajdonság az elsődleges kulcs.
Táblázatot nem lehet tárolni és feldolgozni, ha az adatbázis hiányzó „adatok az adatokról” (metaadatok), mint például a leíró táblázatok, oszlopok, és így tovább. D. A metaadatok is táblázatos formában és tárolja az adatokat szótárban. A táblákon kívül más objektumok is tárolhatók az adatbázisban, például képernyőformátumokban, jelentéssablonokban és alkalmazásinformációkban, amelyek az adatbázis-információkkal dolgoznak.
A relációs modell egyik fontos előnye, hogy keretein belül az adatokkal kapcsolatos cselekvések csökkenthetők a kapcsolatokon végrehajtott relációs algebra műveletekre. Ezek olyan műveletek, mint az unió, a metszéspont, a kivonás, a karteziánus termék, a minta, a vetület, a kapcsolat, a megosztás.
Az adatbázisok megtervezésekor megoldott legfontosabb probléma egy olyan struktúra létrehozása, amely minimális duplikációt biztosítana, egyszerűsítené az adatfeldolgozás és az adatok frissítésének folyamatát. A Coddom az adatok megszervezéséhez egyetemes jellegű formai követelményeket javasolt, amelyek lehetővé teszik a felsorolt problémák hatékony megoldását. Ezeket az adatlapok állapotára vonatkozó követelményeket normál formáknak hívják. Eredetileg három normál formát alakítottak ki. Később megjelent a Boise-Codd normál formája és a magasabb rendek normális formái. Azonban nem alkalmazták széles körben a gyakorlatban.
A relációs adatbázisok elméletében gyakori, hogy megkülönböztessük a normál formák következő sorrendjét:
1) az első normál forma (1NF);
2) a második normál forma (2NF);
3) a harmadik normál forma (3NF);
4) a Boise-Codd (BCNF) szokásos formája;
5) a negyedik normál forma (4NF);
6) az ötödik normál forma (5NF).
Minden normál forma megfelel bizonyos korlátozásoknak. Az arány egy bizonyos rendes formában van, ha megfelel ennek a formának a korlátainak. A DB-kapcsolatok struktúrájának magasabb rendű formákba való átültetésénél megpróbáljuk eltávolítani a redundáns, nem kulcsfontosságú információkat a táblázatokból.
Azt mondják, hogy az arány az első normális formában van, ha minden jellemzője egyszerű.
A kapcsolat a második normál formában van, ha megfelel az első normál forma követelményeinek, és minden nem-kulcs attribútum funkcionálisan teljes mértékben függ a kulcstól (egyedileg meghatározva).
Az arány a harmadik normál formában van, ha megfelel a második normál forma követelményeinek, és minden nem kulcsos attribútum a kulcstól függ. Vegyük észre, hogy a tranzitív olyan függőség, amelyben bármely nem kulcs attribútum egy másik nem kulcs attribútumtól függ, és viszont a kulcstól függ.
Tekintsünk példát arra, hogy a viszonyt a harmadik rendes formához hozzuk. Hagyja, hogy egy kis cég, amely értékesíti a számítógép tartozékait, meg kell rendelnie a rendelési adatokat. Ezek az adatok a következők:
3) cikk (a termék egyedi tételszáma);
4) az áruk megnevezése;
5) a megrendelt áruk ára.
A kapcsolatok normalizálása nem időpocsékolás. Adja meg a kapott példában a "DIMM 32 Mb" "Név" -et a "DIMM 32 Mb SDRAM" -ra. Rendellenes kapcsolat esetén szükséges lenne az összes nevet tartalmazó sor megkeresése és szerkesztése, és a normalizált adatbázisban csak egy kapcsolat egy sorában változhat.
A normalizációs folyamattal és a harmadiknál régebbi normálformák követelményeivel (3NF) kapcsolatos részletek a szakirodalomban találhatók az elméletben
relációs adatbázisok.
A relációs modell fő előnye az egyszerűség. Ennek köszönhetően a valóban működő DBMS túlnyomó többségének alapja.