Szöveges információk kódolása

A modern számítógépek nem csak numerikusak, hanem szövegesek is, más szavakkal - számokat, betűket, írásjeleket, matematikai és egyéb szimbólumokat tartalmazó alfanumerikus információkat. Az ilyen karakter gazdasági, tervezési és gyártási, számviteli információkat, valamint az algoritmikus nyelvű programok szövegeit, stb. Az ilyen információk képviseletéhez változó hosszúságú szavakra van szükség.

A számítógépes rendszerben használt összes szimbólum abszcisza. Különböző típusú karakterkódokat használnak, különböző hosszúságú kódokat használva.

Az üzleti információk átlagosan csaknem kétszer annyi számot tartalmaznak, mint a betűk. Ezért az alfanumerikus karakterek (decimális számjegyek, betűk és egyéb jelek) általános kódolási rendszerével együtt egy külön kódrendszert is megtartanak a kizárólag tizedesjegyből álló adatokra.

A legelterjedtebb az alfanumerikus adatok ábrázolása 8 bites szótagokkal, amelyeket byte-oknak hívnak. Byte használatával 256 különböző karaktert kódolhat (ASCII kód). A számítógépek numerikus formában ábrázolt információkat képesek feldolgozni. A beviteli betűket bizonyos számok kódolják, és amikor olvasásra kerülnek (képernyőn, nyomtatón stb.), Minden számhoz (szimbólumkód) egy szimbólumképet készítenek.

16 bites (két bájtos) karakterkódolás alapján a rendszer univerzálisnak nevezhető - UNICODE. Tizenhat bit lehetővé teszi, hogy egyedi kódokat adjon meg 65.536 karakterből - ez a mező elég ahhoz, hogy egy táblázatban a legtöbb bolygó nyelvének szimbólumát helyezze el.

Képviseletére alfanumerikus karaktert a számítógép memóriájában és adathordozók a mainframe, és néhány más gépek használt bináris kódja információfeldolgozás (DKOI) és mikroprocesszorok, PC és számítógépek - haladó rovására a betűk az orosz ábécé ASCII kódot. Az oroszországi és az orosz internetes szektorban a számítógépes hálózatokban a KOI-8 kodifikáció (nyolcszámjegyű információcsere) széles körben elterjedt. A Windows-1251 orosz nyelvű karakterek másik kódolását a Microsoft vezettette be, számos helyi számítógépen Windows környezetben fut.

Az alfanumerikus információkat változó hosszúságú szavakkal ábrázolják, amelyek tartalmazzák a szükséges számú byte-szimbólumokat (általában 1-től 256 bájtig).

Az adatfeldolgozás automatizálásának egyszerűsítése érdekében a karakterkódolás súlyozási elvét alkalmazzák. A szimbólum kódjának megfelelő bináris számot nevezzük súlyának. A súlykódolásnál a számjegyek súlyai ​​egymás után növekszenek, és a betűkódok súlya betűrendben növekszik. A B betű súlya 1 nagyobb, mint az A betű kódsúlya, és így tovább.

Ha a nevek listáját abc sorrendben kell elrendezni, akkor a kódolás súlyozási elvével ez a művelet számítógép által elvégezhető a vezetéknevek kódképének megfelelő bináris számok összehasonlításával.

A memóriakapacitás megtakarításához és a számtani műveletek számtani műveletek elvégzéséhez a bájtinformáció-reprezentációval rendelkező gépeknél a decimális számok speciális formátumai állnak rendelkezésre:

2) csomagolt ("csomagolt")

A decimális számjegyek 0, 1, 2. 9 jeleket bináris tizedes formában ábrázolják - a 8421 kódot, amelyben a decimális számjegyet a megfelelő 4 bites bináris szám jelöli. A 4 bites kódok (1010-1111) fel nem használt kombinációi karaktereket és szolgáltatás karaktereket kódolnak.

A 8421 kód alkalmas arra, hogy a gép a dekódolási rendszerről binárisra fordítsa, és fordítva. Ez a kód additív, azaz. a két számjegy ábrázolásának összege összegük kódja. Ennek a kódnak a használata azonban azzal függ össze, hogy milyen nehézségek mutatkoznak az átvitelnek a következő tizedesvesszőre és az inverz és kiegészítő kódok átmenetének összetettségét a decimális számokhoz képest, megkönnyítve ezzel az algebrai kiegészítés végrehajtását.

Egy zenekar részt, minden bájt csak egy tizedes számjegy és a szolgáltatási védjegy (terület), négy jobboldali mentesítés bájt, hogy képviselje decimális számok BCD, és négy bal elfoglalt különleges 4-jegyű kódot, úgynevezett zónában.

Az alsó bájt ebben a formátumban a karakterkódokból és a szám alsó decimális számjegyéből áll.

A DCOI-ban szokás kódolni: plusz - 1100, mínusz - 1101 és zóna - 1111.

A zónában a decimális formátumban 6,285 szám van az űrlapon

11110110 11110010 11111000 1101 0101

A tizedespont (pontok) helyére vonatkozó információ a feladat programjában rögzítve van.

Egy alá nem írt decimális szám kódolásakor a zóna kód az alacsony sorrendű byte bal oldali négy bitjére íródik.

A csomagolt byte-ben két tizedesjegyet lehet elhelyezni egy bájtban. A decimális szám mindig egész szám bájt. A jelkód az alacsony sorrendű bájt jobb négy bitében található. Ha a bal leghosszabb (legmagasabb) byte baloldali négy számjegye ingyenes, akkor nullákkal tölti fel őket.

A tömörített decimális formátumú 6285-es számnak van az űrlapja

0000 0110 0010 1000 0101 1101

A csomagolt formátumot a tizedesjegyű műveletek végrehajtásakor használják. Az eredmény ebben a formátumban is elérhető. A művelethez tartozó számok egyenlőtlen hosszúságúak lehetnek. Ezeket egész számokként kezelik, az alacsonyabb rendhez igazítva. A zóna formátumot a decimális adatok bemeneti / kimeneti műveleteihez használják.

A kicsomagolt és csomagolt formátumokat használó számítógépekben vannak utasítások arra, hogy a tizedes számokat a zónás formátumról a csomagolásra és visszafelé konvertálják.

A programozó a szokásos formában ír adatokat. A formanyomtatványból a belső ábrázolásra történő fordítást az adatbeviteli folyamat során végezzük. Az információ kimenetében ugyanazok a közművek fordított fordítást hajtanak végre.

Kapcsolódó cikkek