Informatikus lépésről-lépésre informatika
11. lépés Egységes betűrendes bináris kódolás. Byte code.doc
11. lépés.
Elméleti informatika. Kódolási információ Shannon elméletében.
Egységes betű szerinti bináris kódolás. Byte kód
Ebben a lépésben egy egységes betű szerinti bináris kódolást fogunk tartani; bájt kódot.
Ebben az esetben az elsődleges ábécé bináris kódját egyenlő hosszúságú láncok alkotják, azaz. ugyanazokkal a jelekkel társítva ugyanolyan mennyiségű információ, mint az I0. Nem kell átadnia a jel végét, ezért a kódlánc hosszának meghatározásához használhatja a következő képletet: K (2) log2N. A fogadóeszköz egyszerűen számolja az előzetesen meghatározott elemi jelek számát, és értelmezi a láncot (meghatározza, hogy melyik megjelölés felel meg). Igaz, ebben az esetben a kudarcok elfogadhatatlanok, például az egyik elemi jel kihagyása (olvasatlansága) az egész kódsorozat elmozdulását és helytelen értelmezését eredményezi; A problémát az átvitel szinkronizálásával vagy más eszközökkel oldják meg. Másrészről az egységes kód használata az átviteli pontosság ellenőrzésének egyik eszközévé válik, mivel a túlzott elemi jel vételének ténye, vagy fordítva, a hiányos kód beérkezése azonnal hibaként értelmezhető.
Egy másik fontos példa arra, hogy egységes betű szerinti kódolást használunk, a szimbolikus információk ábrázolása a számítógépben. A kód hosszának meghatározásához el kell kezdeni az elsődleges ábécé karaktereinek számát. A számítógépes ábécé tartalmaznia kell:
262 = a latin betű 52 betűje (beleértve a nagybetűket és kisbetűket);
332 = 66 betű az orosz ábécé;
számok 0,9 - összesen 10;
matematikai műveletek jelei, írásjelek, különleges szimbólumok 20.
Ezt kapjuk az N 148 szimbólumok összes számának. Most meg tudjuk becsülni a kódlánc hosszát: K (2) log2148 7,21. Mivel K (2) egész szám, nyilvánvaló, hogy K (2) = 8. Ez a számítógépes rendszerekben alkalmazott kódolási módszer: minden szimbólum 8 bináris bitet (8 bitet) tartalmaz. Ezt a láncot byte-nek hívták. és a szimbólumok ábrázolása így bájt kódolás.
A bájt mellett egy byte egy egységként használható az információ mennyiségének egy üzenetben történő mérésére. Egy bájt az ábécé szimbólum információinak összegével egyenlő elosztásnak felel meg. Az információmennyiség mérésének ilyen módját volumetrikusnak is nevezik. Legyen egy üzenet (jelek sorrendje); becslése szerint a benne foglalt információ mennyisége a korábban vélt probabilisztikus megközelítés szerint (a Shannon-képlet segítségével) adja meg az Iver-et. és a térfogatmérés megegyezik az Iob értékkel; az értékek közötti kapcsolat:
A bájt az SI-egységek nemzetközi rendszerében az információ mennyiségének mérési egysége. 1 byte = 8 bit. A bájt mellett nagyobb egységeket használnak az információ mennyiségének mérésére:
A 8 bites stringek használatával 2 8 = 256 karaktert kódolhatunk, ami magasabb, mint az N fölött becsült érték, és ezért a kódtáblázat többi részének további karaktereket jeleníthet meg.
Azonban nem elég csak megegyezni egy bizonyos hosszúságú kóddal. Nyilvánvaló, hogy a kódolási módszerek, pl. Számos lehetőség van a nyolcbites láncok elsődleges ábécéjének jeleinek összehasonlítására. Ezért a műszaki eszközök kompatibilitása és az információcsere lehetősége számos fogyasztó között megköveteli a kódok megtárgyalását. Ez a koordináció a kódtáblázatok szabványosítása révén történik. Az első olyan nemzetközi szabvány, amelyet nagyszámítógépeken használtunk, az EBCDIC> (kiterjesztett bináris kódolt decimális átváltási kód) - "a tizedesvágó kód kettős bináris kódolása". A személyi számítógépek és távközlési rendszerek a nemzetközi ASCII byte kódot (American Standard Code for Information Interchange) használják. Szabályozza a kódtáblázat első felének kódjait (kódszámok 0-ról 127-re, azaz az összes 0 kód első bitjére). Ez a rész a nagybetűs és kisbetűs angol betűk, számok, írásjelek és matematikai műveletek kódjait tartalmazza, valamint néhány ellenőrző kódot (számok 0 és 31 között). Az alábbiakban néhány ASCII kód található:
1. táblázat. Néhány ASCII kód Jel, kulcs