Betűrendben megközelítést az az információ mennyiségét

Értelmes megközelítés értékelését az információk mennyisége. amit korábban tárgyaltuk, ez mennyiségét méri csökkentéseként a bizonytalanság a tudásunk.

Az elv az alfabetikus megközelítést az az információ mennyiségét

Betűrendben megközelítés alapja az az elv azt állítja, hogy a levél is képviselteti formájában kódok véges karaktersorozat szereplő minden ábécé. adathordozók tartalmazó bármilyen karaktersor tárolható, továbbított és feldolgozott, mint a segítségével egy férfi, és segítségével a műszaki berendezések, különösen a számítógépet. Ezt a megközelítést ismertetik AN Kolmogorov, amely szerint az információ tartalma, amely a szimbólumok sorozatát nem függhet a tartalmát az üzenetet, de csak akkor határozza meg a minimális számú karakter kódolásához szükséges azt. Egy ilyen megközelítés annak értékeléséhez, az információ mennyisége objektív, hiszen nem függ a címzett megkapja az üzenetet. Az mit jelent az üzenet lehet figyelembe venni csak abban a szakaszban adja meg a kódolás ábécé vagy nem tekinthető egyáltalán.

Problémák kontroll minden tantárgyból. 10 éves tapasztalat! Ár 100 rubelt. 1-jétől nap!

A legegyszerűbb módja annak, hogy értem - gondoljunk bármilyen szöveget írt bármely nyelven. Számunkra természetesen a legkényelmesebb lenne a szövege oroszul.

Teljesítmény ábécé és információs kapacitását. képletű Hartley

Az egész sor karakterek teszik ki a nyelvet, akkor hagyományosan nevezhető az ábécé. Általános szabály, hogy ábécé kifejezés csak a levél, de ettől eltekintve őket, ha írással használt írásjelek, számok, zárójelek, terek is, viszont lehet venni az ábécé.

Így az ábécé - egy sor használt szimbólumokat szövegbevitel.

Kapacitás (mérete) az ábécé - a karakterek száma az ábécé.

Teljesítmény ábécé jelöli $ N $.

Teljesítmény ábécé álló betűk az orosz (cirill), egyenlő $ 33 $;

Teljesítmény ábécé álló betűk - $ 26 $;

Teljesítmény ábécé beírt szöveget számítógépes billentyűzet $ 256 $ (a nagybetűs és kisbetűs latin és az orosz betűk, számok aritmetikai operátorok, zárójel írásjel stb);

Teljesítmény bináris ábécé egyenlő $ 2 $.

Amikor az abc megközelítés feltételezi, hogy minden karaktert a szöveg hordoz némi információt kapacitást, ami viszont függ a teljesítmény az ábécé.

Levelek, amelyen keresztül egy üzenete van, áll $ N $ karakter. A legegyszerűbb esetben, a hossza az üzenet kódját, egyenlő egy karaktert, a küldő küldhet egy $ N $ lehetséges üzeneteket, amelyek lesz az információk mennyisége egyenlő $ I $, a következő képlet szerint:

ahol a $ N $ - a karakterek száma az ábécé jelrendszer

$ I $ - az információk mennyisége által hordozott minden karakter.

Ez a képlet származik R. Hartley, ami $ 20 $ edik év a múlt század, megalapozta az információ-elmélet, amely meghatározza az intézkedés az információk mennyisége bizonyos problémák megoldásában.

Hartley azt állította, hogy az információk mennyisége a jelentésben szereplő, befolyásolhatja a meglepetés faktor, ami viszont függ a valószínűsége veszi az üzenetet. Ha a valószínűsége megszerzésének magas oszlopok, és a meglepetés ugyanakkor alacsony, az üzenet tartalmazni fogja kevés információt nyújt a személy.

Azonban, amikor létrehoztuk a képlet R.Hartli teljesen kizárt meglepő tényező. Hartley formula csak akkor működik, ha a karakterek megjelenését azonos valószínűséggel, és ezek statisztikailag független.

Például, a fenti képlet alkalmazásával, hogy meghatározzuk a több információs, amely hordozza karakter bináris jelölés:

Információ kapacitás bináris rendszer jel bit értéke 1.

Meg kell határozni azokat az információkat kapacitása a betűk az orosz ábécé (anélkül, hogy az „e” betű).

Képzeljük el, hogy a szöveg megkaptuk egymást, az egyik karakter, mint egy papírszalag, kimászni a távíró. Tegyük fel, hogy minden karaktert, hogy megjelenik a szalag, egyformán valószínű, hogy bármely szimbólum ábécé. A valóságban ez nem így van, de az egyszerűség kedvéért azt feltételezzük, hogy a feltételezés.

Minden szabályos helyzetben a szöveg jelenik meg bármelyik $ N $ karakter. Ezután, az ismert képlet, minden egyes szimbólum számos adatok egyenlő a $ i $ bit, amely meghatározható megoldása az egyenlet:

Az információs kapacitását a betűk az orosz ábécé $ 5 $ bit információt.

Így a képlet meghatározására $ N $ tárgya a számos lehetséges események és az információ mennyisége, amely tartalmazza a kapott üzenetet. A probléma tekinthető a fenti $ N $ - a karakterek számát az orosz ábécé, és $ I $ - mennyiségű információt hordoz egy levelet.

Egy üzenet sorozatából áll karakterek, amelyek mindegyike hordoz egy bizonyos mennyiségű információt.

lehet meghatározni a következő képlet segítségével az információk mennyisége az üzenet:

ahol a $ I_c $ - tartalmazott információk mennyiségének az üzenetben;

$ I $ - az információk mennyisége által hordozott egyetlen karakter (információk kapacitás);

$ K $ - karakterek száma az üzenetben.

Meg kell határozni, hogy mennyi információt tartalmaz a „Hello”. Ha azt feltételezzük, hogy az ábécé áll $ 32 $ betűk (anélkül, hogy „e” betű)?

Határozat. Hogy oldja meg a problémát, először meghatározzák a karakterek száma az üzenetet, és a felhasznált energia ábécé.

A karakterek száma az üzenet: $ K = 6 $,

és a hatalom az ábécé: $ N = 32 $.

Meg kell határozni, hogy mennyi információt tartalmaz a „Hello”.

Ehhez szaporodnak az információk mennyisége által hordozott egyetlen karakter ($ I $), a karakterek száma az üzenetben ($ K $), azaz használja a következő képletet: $ I_c = K \ cdot I $.

Azonban nem tudjuk használni ezt a képletet, mert nem tudjuk, hogy mennyi információt azonos jel ($ I $).

A probléma megoldása érdekében használjuk a képlet Hartley. Egy üzenet kerül rögzítésre segítségével az ábécé, amelynek ereje egyenlő $ 32 $, azaz $ N = 32 $.

Megoldása az egyenlet, a következő képlet segítségével $ N = 2 ^ I $, kaptunk információt, hogy a több $ I = $ 5 bitet. Ismerve az információk mennyisége, amely egyetlen karakterét ábécé, és a karakterek száma az üzenet, akkor meghatározhatja, hogy mennyi információt tartalmaz üzenetünket.

Tehát: $ I_c = K \ cdot I = 6 \ cdot $ 5 = 30 bit.

Amikor a mért adatok kényelmes a használata az ábécé mérete $ N $, egyenlő egész szám erejét két. Például, ha $ N = $ 16, akkor ez azt jelenti, hogy minden egyes szimbólum hordoz 4 $ $ bites információkat a $ 2 ^ 4 = $ 16.

Jegye információ

Korlátozza a maximális mérete az ábécé elméletileg nem létezik. Azonban van egy ábécé, hogy lehet nevezni elegendő. Akkor használják, ha egy számítógéppel dolgozó. A hatalom ezt ábécé - $ 256 $ karakter. Ez magában foglalja szinte az összes szimbólumot: a latin és az orosz betűk, számok aritmetikai operátorok, mindenféle konzolok írásjelek.

Mivel a 256 $ = 2 ^ 8 $, ebből következik, hogy $ 1 $ jel az ábécé tartalmaz $ 8 $ bit információt. Ez az érték az alapja a számítógépes technológia és nevezik - bájt.

Az ábécé, amely még mindig az úgynevezett ASCII-kód táblázat, akkor könnyen kiszámítható az információk mennyisége a szövegben. Ebben az esetben a $ 1, $ szimbólum ábécé tartalmaz $ 1 $ bájt információt, így most kell meghatározni a karakterek száma, a szám, amit kap egy eredményt, és kifejezni az összeget a szöveges információt bájt.

Tegyük fel, hogy egy kis könyvet, nyomtatott nyomtató, amely magában foglalja $ 50 $ oldal, minden oldalon található $ 50 $ sor, soronként - $ 60 $ karakter.

Kapcsolódó cikkek