Egységes betű szerinti bináris kódolás 1
Ebben az esetben az elsődleges ábécé bináris kódját egyenlő hosszúságú láncok alkotják, azaz. ugyanazokkal a jelekkel társítva ugyanolyan mennyiségű információval, mint I (A) = log2N. A jel végének jelzésére nincs szükség, ezért a kód hosszának meghatározásához használhatjuk a K (A, 2)> log2N képletet. A fogadóeszköz egyszerűen számolja az előzetesen meghatározott elemi jelek számát, és értelmezi a láncot (meghatározza, melyik jel felel meg), korrelálva a kódtáblával. Azonban, így elfogadhatatlan hibák, például, egy pass (Skipping) egy chip egy eltolódáshoz vezetnek a teljes kód-szekvencia és annak téves értelmezésére; A probléma megoldható az átvitel szinkronizálásával vagy más eszközökkel, amelyeket a Ch. 5. Másrészt, a használata egységes szabályzat egyik ellenőrző eszközök átviteli rendesen, mert az a tény kézhezvételétől felesleges chip, vagy pedig a szállítás hiányos kódot közvetlenül értelmezhető, mint egy hiba.
Egy másik fontos példa arra, hogy egységes betű szerinti kódolást használunk, a szimbolikus (jel) információ reprezentációja a számítógépben. A kód hosszának meghatározásához el kell kezdeni az elsődleges ábécé karaktereinek számát. A számítógépes ábécé tartalmaznia kell:
· 26 х 2 = a latin ábécé 52 betűje (beleértve a nagybetűket és a kisbetűket);
· 33 x 2 = az orosz betű 66 betűje;
· 0-as számjegyek - csak 10;
· Matematikai műveletek jelei, írásjelek, különleges szimbólumok ≈ 20.
Azt kapjuk, hogy a szimbólumok teljes száma N ≈ 148. Most meg tudjuk becsülni a kódlánc hosszát: K (c, 2) ≥ log2 148 ≥ 7.21. Mivel a kódot hossza egész szám, nyilvánvalóan, K (s, 2) = 8. Ez a kódolási eljárás elfogadott számítógépes rendszerek bármely szimbólum van hozzárendelve egy kódot a 8 bit (8 bit). Ezt a szekvenciát a tárolása és feldolgozása, mint egész (vagyis, nincs hozzáférés egyetlen bit) - emiatt kapacitás számítógépes eszköz, információ tárolására vagy feldolgozására többszöröse 8. A sor nyolc rokon bitek nevű bájt, és így képviselet szimbólumok byte kódolással.
A bájt mellett egy byte egy egységként használható az információ mennyiségének egy üzenetben történő mérésére. Egy bájt az ábécé egyik karakterével megegyező mennyiségű információnak felel meg azok egyenetlen eloszlásával. Az információmennyiség mérésének ilyen módját volumetrikusnak is nevezik. Legyen egy üzenet (jelek sorrendje); a korábban vizsgált valószínűségi megközelítés szerint benne foglalt információ mennyiségének becslése (a Shannon-képlet segítségével (2.17)) az Iver-et adja. és a térfogatmérés megegyezik az Iob értékkel; ezeknek a mennyiségeknek a viszonya a (2.7) -től függ:
A bájt az SI-egységek nemzetközi rendszerében az információ mennyiségének mérési egysége. 1 byte = 8 bit. A bájt mellett nagyobb egységeket használnak az információ mennyiségének mérésére:
8 bites láncok lehetővé teszi kódolnak augusztus 2 = 256 szimbólumot, amely meghaladja a becsült fenti N, és ezért lehetővé teszi, hogy használja a fennmaradó kódkönyv, hogy képviselje a kiegészítő jel.
Azonban nem elég csak megegyezni egy bizonyos hosszúságú kóddal. Nyilvánvaló, hogy a kódolási módszerek, pl. Számos lehetőség van a nyolcbites láncok elsődleges ábécéjének jeleinek összehasonlítására. Ezért a műszaki eszközök kompatibilitása és az információcsere lehetősége számos fogyasztó között megköveteli a kódok megtárgyalását. Ez a koordináció a kódtáblázatok szabványosítása révén történik.
Az első olyan nemzetközi szabvány, amelyet nagyszámítógépen használtunk, az EBCDIC (Extended Binary Coded Decimal Interchange Code) - "a tizedescserénk kódjának kiterjesztett bináris kódolása". A személyi számítógépek és távközlési rendszerek a nemzetközi ASCII byte kódot (American Standard Code for Information Interchange) használják.
Szabályozza a kódtáblázat első felének kódjait (kódszámok 0-ról 127-re, azaz az összes 0 kód első bitjére). Ebben a részben a kódok őszén a nagybetűs és kisbetűs angol betűket, számokat, írásjeleket és a matematikai műveleteket, valamint néhány kontroll (számokat 0-31) keletkezik, amikor a billentyűzet segítségével. Az alábbiakban néhány FSC kód található:
A kódtáblázat második része - a fő kód kiterjesztésének tekinthető - 128 és 255 közötti tartományba esik (az 1-es kódok első bitje). A nemzeti betűk (pl. Orosz) szimbólumainak, valamint az ál-grafikák szimbólumainak a ábrázolására szolgál. Ehhez a részhez vannak olyan szabványok is, mint például az orosz nyelv szimbólumainak, KOI-8, KOI-7 stb.
Mivel a főtábla és bővítését a kód betűk és számok felelnek meg a lexikográfiai érdekében (azaz a sorrendben az ábécé) - ez lehetővé teszi, hogy automatizálják szó feldolgozási sebességet.
Jelenleg megjelent egy újabb nemzetközi szabvány a Unicode kódolására, és egyre szélesebb körben használják. Ennek jellemzője, hogy 16 bites kódolást használ, azaz. Az egyes karakterek megjelenítéséhez 2 bájt van elosztva. Ez a kód hossza 65 536 karaktert tartalmaz az elsődleges ábécében. Ez viszont lehetővé teszi közös kódtáblázat létrehozását és használatát az összes általános ábécé számára.
Vissza a tartalomjegyzékhez: Az informatika elméleti alapjai