szöveges kódolás

erős kezdése

A mai napig, ASCII kód egy szabványos formában az első 128-értékek (beleértve a számok és írásjelek) az angol ábécé, bemutatott egy bizonyos sorrendben.

Azonban még 1 byte lehetővé teszi kódoló 2-szer nagyobb, mint az értékeket, azaz, nem a 128, akár 256 különböző értéket. Ezért elég gyors, hogy cserélje ki az alapvető ASCII kezdtek megjelenni fejlettebb változatai a híres és népszerű a mai napig kódolás, amelyben kódolt karaktereket ábécét, és ennek megfelelően a szöveg különböző nyelven, köztük oroszul.

Extended ASCII Oroszország

A mai napig, az orosz nép a kiemelt yavlyayutsyakodirovka Windows1251 és a Unicode és az UTF 8. bekövetkezett ASCII.

Sőt, előfordulhat, hogy van egy nagyon korrekt kérdést: „Miért van szükség a szövegek kódolás?”
Érdemes megjegyezni, hogy a számítógép - ez csak egy gép, ami kell fellépnie az utasítások szerint egyértelműen. Annak érdekében, hogy egyértelmű, hogy mit kell csinálni minden egyes karakter van írva, akkor kerül bemutatásra, mint egy sor vektoros formák, mindegyik amelyek küldeni a megfelelő helyen jelenik meg a képernyőn, vagy ezt az elnevezést.

A formáció vektoros formák megfelelnek a betűtípus és a kódolási folyamat függ az operációs rendszer, valamint az alkalmazott ő programjait. Így minden szöveges lényegét - egy sor bájt, amelyek mindegyike képviseli kódoló egy napisannogosimvola. A programot szentelt megjelenítésére nyomtatott információk a képernyőn (ez lehet a böngésző vagy szövegszerkesztő), értelmezi a kódot, megtalálják a megfelelő kijelző kódszáma az kódtáblát, átalakítja a kívánt vektor formában jeleníti meg egy szöveges fájlt.

Kódoló CP866 és KOI8-R széles körben használják eljövetele előtt a grafikus operációs rendszert tett szert népszerűségre szerte a világon, - a Windows. Most a legnépszerűbb kódolás, támogatja Oroszország lett Windows1251.

Azonban nem ez az egyetlen, ezért a gyártók az orosz használt betűtípusok a szoftver időről időre még mindig látni a sok nehézséget okoz a helytelen jelképek, és a megjelenése az úgynevezett halandzsa. Ezek abszurd karakterek az eredménye nem megfelelő használata kódolás asztalok, azaz különböző táblázatok alkalmazott kódolást és dekódolást.

Ugyanez a helyzet is előfordul weboldalak, blogok és egyéb források, ahol információt az orosz és más külföldi csak angol karaktereket. Ez a helyzet határozza meg az alapvető előfeltétele egy univerzális kódolási lehetővé teszi, hogy kódolni bármilyen nyelvű szöveget, még a kínai, ahol a karakterek sokkal több, mint 256.

Univerzális kódolás

Az első változat egy univerzális kódolás alatt fejlődött Unicode Consortium, UTF 32. kódoló kódolására használt 32 bit minden egyes szimbólum. Most azt végrehajtották képes kódolni a rengeteg karakter, de volt egy másik probléma -A legtöbb európai országban a számos extra karakterek már teljesen felesleges. Sőt, a beszerzett iratok nagyon nehéz. Ezért, hogy cserélje ki az UTF-32 jött UTF 16. lett az alapja az összes használt karakterek hazánkban és azon túl.

De még mindig volt egy csomó elégedetlen. Például azok, akik beszéltek csak angolul, az átmenet ASCII UTF16 dokumentumaikat is növekedett a mérete, és jelentősen, majdnem 2-szer.
Az eredmény egy változó hosszúságú kódolás UTF 8. Lehetséges, hogy nem növeli a súlyát a szöveget.

Krakozyabry és módszerek a velük foglalkozó

Általában a kódolás van megadva az oldalon, ahol generált tájékoztató üzenet is. Ennek eredményeként, az elején a dokumentum kialakult egyfajta címke, amely a tárolt növekvő vagy csökkenő sorrendben felvett UTF16 karakter kódok.

Ha valami már megjelent UTF-8. akkor nincs marker az elején ott, mert az nagyon a felvétel lehetőségét a karakter kód fordított sorrendben e kódolási hiányzik.

Egy másik hasznos tanácsokat leküzdésére krakozyabrami - regisztrálja a fejléc minden oldalon kód információ helyes kódolása szöveget minden helyi gazda, vagy a kiszolgáló nem zavart.

Kapcsolódó cikkek:

Kapcsolódó cikkek

előző ◈ a következő