Betűrendben megközelítés mérési adatok

Laboratóriumi munka №1

Számítástechnika, használják a különböző megközelítések a mérési adatok:

Az információ mennyisége - ez az intézkedés csökkenti a bizonytalanságot.

Értelmes megközelítése a mérési adatokat.

Post - tájékoztató patak, amely belép a folyamat információ továbbítására a vevő. Üzenet információt hordoz az a személy, ha az abban foglalt információt az új neki, és érthető információkat - az emberi tudás. Az üzenet legyen informatív. Ha az üzenet nem informatív, az információk mennyisége a szempontból az a személy = 0 (Példa: egy egyetemi tankönyv magasabb matematika magában foglalja az ismeretek, de ezek nem állnak rendelkezésre, 1. osztályos).

Legyen egy üzenetet tartalmaz információt arról, hogy mi történt az egyik N egyformán valószínű eseményeket. Az információk mennyisége i, a jelentésben szereplő, hogy volt az egyik N egyenlően valószínű eseményeket, meg lehet határozni Hartley:

Ez a képlet szemléltető egyenletet az ismeretlen i. Matematika ismert, hogy a megoldás ennek az egyenletnek a következő formában:

Ha N egyenlő egész szám erejét két (2,4,8,16, és így tovább. D.), akkor ez az egyenlet megoldható „a szem előtt”.

Pepita áll 64 mezőket: 8 oszlopok 8 sor. Mi a bitek száma üzenetet hordoz kiválasztásakor a sakktábla?

Mivel a választott bármely equiprobable 64 sejtek, a bitek száma alapján határozzuk meg a képlet:



Betűrendben megközelítés mérési adatokat.

Alphabet - a szimbólumokat használják a nyelvet.

Általában az ábécé alatt nem csak betűk, számok, írásjelek és terek.

Teljesítmény ábécé (N) - a szimbólumok számát használt az ábécé.

Például. Alphabet ereje orosz betűk 32 (a levél e általában nem használják).

Feltételezve, hogy az összes karakter az ábécé jelenik meg a szövegben azonos gyakorisággal (azonos a valószínűsége), az összeg a hordozott információ minden egyes karakter kiszámítása az alábbi képlet szerint Hartley:

ahol N - a hatalom az ábécé.

Hartley képlet megadja a kapcsolatot a számos lehetséges események és a mennyiségű N informatsiii:

A bázis során számítástechnika ismert, hogy a számítógépek bináris kódolása információkat. A bináris szövegének a számítógép leggyakrabban használt egységes nyolc számjegyű kódot. Ezt fel lehet használni, hogy kódolni egy ábécé 256 szimbólum, mert 256 = 8 februárban.

A szabványos kód tábla (pl ASCII) elhelyezett összes karakter: angol és orosz kis- és nagybetűket, számokat, írásjeleket aritmetikai operátorok, mindenféle konzolok és így tovább.

A bináris egybites hordoz egy információs egység, amely az úgynevezett 1 bit.

Például egy 2-szimbólum ábécé, minden egyes karakter "súlya" 1 bites (log22 = 1); egy 4 karakteres ábécé, minden szimbólum hordoz 2 bit információt (log2 4 = 2); 8-jelleg - 3 bit (log2 8 = 3), stb ...

Egy szimbólum az ábécé kapacitása 256 (2, 8) hordozza szöveges 8 bit információt. Ez az összeg az információ az úgynevezett byte.

Az összeg a szöveges információ a számítógép memóriájában mérik bájt. Ez megegyezik a karakterek számát a szövegbevitel.

Mérésére használják fel az információkat, és nagyobb egységek:

Neve egység

A számérték byte

Ha az összes szöveget tartalmaz K szimbólumok, akkor az abc megközelítés térfogata V foglalt információt egyenlő:

ahol i - a tömeg információt egy szimbólum ábécét.

Annak ismeretében, hogy i = log2 N, A fenti képlet képviselheti más formában:

Ha ez a szám egyenlő N karakter az ábécé, és a karakterek száma az üzenetben felvétel - K, az adatmennyiség V ezt az üzenetet adja:

Amikor alfabetikus megközelítés mennyiségének mérésével szöveges adatok információk csak attól függ a szöveg mérete és ereje az ábécé és a tartalmát nem. Ezért nem lehet összehasonlítani az információ mennyisége írott szövegek különböző nyelveken, a méret a szöveget.

Feltételezve, hogy mindegyik karakter van kódolva egyetlen bájt, az információk mennyisége a szavazás a következő mondattal: hosszú és kanyargós úton a ködben a kék tenger!

Mivel a mondat 44 karakter (beleértve a központozás és terek), akkor az adatok térfogatát számítjuk a következő képlet szerint:

V = 44 # 8901; 1 bájt = 44 bájt = 44 # 8901; 8 bit = 352 bit