Mennyiségi paraméterek a szöveges dokumentumok

Kulcsszavak:

4.6.1. Bemutatása szöveges információt a számítógép memóriájában

A szöveg áll karakterek - betűk, számok, írásjelek, stb, hogy az egyik felismeri alakú ... A számítógép megkülönbözteti a beírt karakterek által bináris kód. Akkor nyomja meg a billentyűzet karakter billentyűt és a számítógép kap egy bizonyos sorrendben az elektromos impulzusok a változó erősségű, ami lehet például egy sor nyolc nullák (bináris kód).

Már beszéltünk arról, hogy bites bináris kód i száma és a lehetséges kombinációk kód N kapcsolja össze: 2 i = N. nyolc bites bináris kód lehetővé teszi, hogy 256 különböző kód kombinációk február 8 = 256.

Egy ilyen nagy számú kód kombinációk kódolják az összes karakter a számítógépen található billentyűzet - a nagybetűs és kisbetűs magyar és angol betűket, számokat, írásjeleket aritmetikai operátorok, zárójel stb, valamint néhány vezérlő karakterek, amelyek nélkülözhetetlenek a teremtés .. szöveges dokumentum (törli az előző karakter, line feed, hely, stb.)

A megegyezést jellegű képeket és karakter kódok segítségével állíthatjuk be kódtáblák.

Minden kódtáblák használt számítógép és az összes operációs rendszerek, ki van téve a nemzetközi karakterkódolás szabványoknak.

Kód táblázat tartalmazza a kódokat 256 különböző karakter, számozott mintegy 255. Az első 128 kódok minden kódtáblákban megfelelnek az azonos szimbólum:

• kódok számok O 32 megfelelnek a vezérlő szimbólumok;
• kódok indexek 33-127 megfelelnek az szimbólumok ábrázolt - latin betűkkel, írásjelek, számok, szimbólumok, aritmetikai műveletek, stb ...

Ezek a kódok kerültek kifejlesztésre az USA-ban, és megvan a neve az ASCII (American Standart Code for Information Interchange - American Standard Code for Information Interchange).

4.1 táblázat tartalmazza az ASCII fragmenst kódoló.

Mennyiségi paraméterek a szöveges dokumentumok

Kódok szám 128-255 használt kódoló nemzeti ábécé betűit, a valuta szimbólumok és m. P. Ezért a kód táblázatok különböző nyelveken, hogy ugyanazt a kódot felelnek meg a különböző karaktereket. Sőt, sok nyelven több változata van a kód táblázatok (például, körülbelül egy tucat! Magyar nyelvű).

4.2 táblázat mutatja be a decimális és a bináris kódokat számos magyar ábécé két különböző kódolás.

Mennyiségi paraméterek a szöveges dokumentumok

Például egy szekvenciát a bináris kódok

11010010 11001010 11010001 11000101 11010010

A kódoló a Windows fog egyezni a „TEXT” és KOI-8 - egy értelmetlen sor „reyyar” karaktereket.

Általános szabály, hogy a felhasználónak nem kell aggódnia újra kódoló szöveges dokumentumok, hiszen ez teszi különleges pro- gramm átalakítók beépített operációs rendszer és az alkalmazások.

Kódolás oktett egy komoly korlátozást: a számos különböző jellegű kódok ezen kódolási nem elég nagy ahhoz, hogy képes legyen használni egyszerre kettőnél több nyelven. E korlátozás kiküszöbölése érdekében kifejlesztett egy új karakterkódolást Unicode megkapta a nevét. A Unicode, minden karaktert kódolt hexadecimális bináris kódot. Ez lehetővé teszi, hogy a bitek száma kódolásához 65,536 különböző karakterek:

Az első 128 karakter Unicode egybeesik az ASCII tábla; továbbá úgy ábécé összes modern nyelvek, valamint minden egyéb tudományos és matematikai szimbolikus jelöléssel. Minden évben, Unicode egyre elterjedtebbé válik.

amely segít elképzelni, hogy a karakter kódja van kialakítva, be a billentyűzetről.

4.6.2. Információ térfogata szövegrészt

Tudtad, hogy az információ üzenetek mennyisége I egyenlő a termék a karakterek száma egy üzenetet az információt a szimbólum az ábécé súly i: I = K • i.

Attól függően, hogy kicsit használt kódolás tájékoztató súlyok szöveges karaktert. számítógépen készített, egyenlő lehet:

• 8 bit (1 bájt) - egy nyolcjegyű kódolás;

• 16 bit (2 bájt) - hexadecimális kódolása.

Adatállomány darab szöveg fogják hívni a bitek száma, bájt, illetve származtatott egységek (kilobájt, megabájt, és így tovább. D.) Szükséges a felvétel a fragmentum előre egyeztetett módszer bináris kódolás.

1. feladat. Feltételezve, hogy az egyes szimbólumok által kódolt egy byte határozza meg, mi van a következő adatállomány megnyilatkozás Jean-Jacques Rousseau

Ezer út vezet zavart, hogy az igazság - az egyetlen.

Határozat. Ebben a szövegben 57 karaktert (szóközökkel és írásjelek). Minden karakter van kódolva egyetlen bájt. Ezért egy adatállomány a teljes szöveg - 57 bájt.

Probléma 2. A Unicode karakter minden kiosztott két bájt. Határozza meg az információ mennyiségét a szöveg 24 karakter hosszú e kódolást.

Probléma 3. Automatikus megvalósított eszköz rögzítési információ üzenet orosz eredetileg írt a 8-bites kódot, 16 bites Unicode kódolást. Ebben az esetben egy üzenet nőtt 2048 bájt. Mi volt az üzenetek mennyisége információt átalakítás?

Határozat. Információ tömege egyes jelekre a 16 bites kódolású súlyának kétszeresét információs szimbólum egy 8 bites kódolás. Ezért, amikor átkódolás az eredeti blokk információt egy 8-bites kódolás saját 16-bites információ mennyiség nőtt kétszer, más szóval, amelynek összege megegyezik az eredeti információ mennyiség. Ezért, egy információs üzenetek mennyisége átalakítás előtt 2048 bájt = 2 KB.

4. feladat Express megabájt térfogata szöveges információ „Contemporary idegen szavak szótára” oldalakról 740, ha elhelyezkedik átlagosan 60 sor 80 karakter (szóközökkel együtt) egy oldalon. Vegye figyelembe, hogy a felvételi kapacitást az ábécé használtuk 256 karakter lehet.

Határozat. Információ teherbírása betűjelzés 256 nyolc bit (egy bájt). A karakterek száma az egész szótárt egyenlő 740 • 80 • 60 = 3552 LLC. Következésképpen, a szöveg mennyisége bájtban egyenlő 3552 bájt Ltd. 3 = 468,75 Kbyte ≈ 3,39 Mb.

LEGFONTOSABB

A szöveg áll karakterek - betűk, számok, írásjelek, stb, hogy az egyik felismeri alakú ... A számítógép megkülönbözteti a beírt karakterek által bináris kód. A megegyezést a képek és a karakter kódok segítségével állíthatjuk be kódtáblák.

Attól függően, hogy kicsit használt kódolás tömeg információs szöveget szimbólum generált számítógép lehet egyenlő:

• 8 bit (1 bájt) - egy nyolcjegyű kódolás;
• 16 bit (2 bájt) - hexadecimális kódolása.

Adatállomány szövegrészt - a bitek száma, bájt (kilobájt, megabájt) nyilvántartáshoz szükséges kódoló fragment egyeztetett módon.

Kérdések és feladatok

1. Tekintse át a prezentációs anyagok a bekezdésben szereplő elektronikus kérelmet a tankönyv. Ezeknek az anyagoknak előállítására válaszok kérdések és feladatok.

2. Miért a kódolás, ahol minden egyes karakter van kódolva a lánc nyolc nullák, más néven egy byte-os?

3. Mi a célja az Unicode kódolást vezettek be? További információk a kódolást.

4. információkat az interneten az egyik helyeket mutatja annyira. az alábbiak szerint.

Ez annak volt köszönhető, hogy:

1) a számítógépre telepített tartalomszűrő rendszer

2) helytelen monitor beállításait

3) Érvénytelen oldal meghatározás kódolások

5. Annak ismeretében, hogy a ASCII kódot minden kisbetűk 32 további megfelelő kódot nagybetűvel, dekódolni a következő üzenet:

77 105 107 107 121 32 77 111 117 115 101

6. Ha feltételezzük, hogy az egyes szimbólumok által kódolt egy byte határozza meg, mi van a következő adatállomány megnyilatkozás Alekseya Tolstogo:

Ne tévessze össze az egyetlen, aki nem csinál semmit, de ez a fő hiba.

7. Feltételezve, hogy mindegyik szimbólum van kódolva, hogy 16 bit, sebesség információt térfogata alábbi kifejezések A. S. Pushkina Unicode kódolás:

A szokás adott nekünk felülről: cseréje boldogságát.

8. A szöveges módban, a számítógép képernyője általában osztva 25 sor 80 karakter soronként. Mennyiségének meghatározása a szövegben, amely elfoglalja a teljes képernyőt a monitor, Unicode-ban.

9. Adjon foglal oldalak 6-40 sor, minden sorban tartalmaz 60 szimbólumok. Adatállomány az egész üzenet 28800 bájt. Hány bit használtak kódolására egy karaktert?

10. Az üzenet adatállomány, amely 5 byte, elfoglalja 4 oldal 32 sor, amelyek mindegyike rögzített 40 karakter. Hány karakter az ábécé a nyelvet, amelyen van írva az üzenet?

Elektronikus Oktatási

Bemutatása „Assessment mennyiségi paraméterek a szöveges dokumentumok”

Az egységes gyűjtemény digitális oktatási források

1) szimulátor „Interaktív könyv a problémákat. A „bemutatása jellegű információ” »(N 119265).

FTSIOR erőforrások

(Megjegyzés: a lejátszási modult kell telepíteni a számítógép erőforrásait a játékos.) Letöltés játékos FTSIOR erőforrások

1) információs modul a tárgya „bemutatása a szöveg különböző kódolások”;

2) a gyakorlati modul „benyújtása a szöveg különböző kódolások”;

3) vezérlő modul „benyújtása a szöveg különböző kódolások”.

A gyakorlati része a leckét

1) végre munkát № 218, № 219, № 221, № 223, № 225, № 230 RT.

2) Együttműködés a képzés hallgatói interaktív könyv a problémák. A „bemutatása jellegű információ” »(N 119265) a gyakorlatban módban.

A gyakorlati munka №12
„Scanning és elismerése szöveges dokumentumok”

Feladat 1. Scanning

1. Nyissa ki a fedelet a számítógéphez csatlakoztatott síkágyas szkenner. Helyezze a dokumentumot a lapolvasó üvegre nyomtatott oldallal (szöveg) lefelé. Óvatosan zárja le a szkenner fedelét.

2. Indítsa el a szkennelési programot, melyet a szkennert. Fedezze lapolvasószoftver eszköztáron található a Scan gombra, majd kattintson rá.

3. Várja meg, amíg a beolvasás érettségi.

4. Mentse a szkennelt dokumentumot a személyes képfájlba nevű mappa Scan és tif kiterjesztésű, BMB, jpg, png és mások.

5. Zárja le a kereső programot.

Feladat 2. Az elismerés

1. Csatlakozás az internethez a Chrome böngészőt futtató.

2. Indítsa el az OCR ingyenes online szolgáltatás (www.newocr.com).

Ahhoz, hogy működjön együtt a helyszínen lehet kihasználni az automatikus fordítási rendszer. Ha tolmács nem szerepel, akkor az oldal fordítását, kattintson jobb egérgombbal, és válassza a Fordítás Magyarországon a helyi menüben.

3. Kattintson a Fájl kiválasztása gombra. keresse meg és nyissa meg a létrehozott fájlt az előző feladat.

4. Kattintson a gombra. Várj Image (); Ha szükséges, kapcsolja ().

5. Kattintson a gombra. Várja meg, amíg a végén a felismerés (), és a megjelenése a területen a felismert szöveget.

6. Töltsük be a felismert szöveget a Word szövegszerkesztő.

Mennyiségi paraméterek a szöveges dokumentumok

7. Kapcsolja be a megjelenítési módot a rejtett formázó karaktereket (). Töltsön szerkeszt egy szöveges dokumentumot: távolítsa el a felesleges karaktereket a bekezdés vége, vegye figyelembe a bizonytalan szavak és szimbólumok.

8. Mentse a munkáját a személyes mappa fájl elismerést.

Most már tudja:

• Scan szöveges dokumentumok;
• Végezze el az elismerése beolvasott szöveges dokumentumok az online szolgáltatás használatával.