Windows 1251 és utf-8 ez, és hogyan kell használni
Szia, kedves olvasók a blogomban. Ma fogunk beszélni veled a kódolást. Ha elolvasod a cikket, hogyan lehet megtekinteni az oldalt a böngészőben. tudja, hogy bármilyen dokumentumot az interneten nem tárolja a formában, amelyben vagyunk szokva, hogy látja. Ő rögzített homályos ember szimbólumok és jelek. A szöveg minden ugyanaz.
Számos kódolást, hanem azért, mert néha olyan furcsa karakter, amikor megnyitja a munkafüzetet egy mobil alkalmazás vagy gashes cikket a honlapon, akkor változnak egyes értékek a beállítások, akkor megjelenik az ismerős szem ábécé.
Windows 1251 - mi ez, milyen értéke van az olyan webhelyek létrehozására, amely karakter lesz elérhető, és hogy ez a legjobb megoldás a mai? Mindez a mai cikkben. Mint mindig, egyszerű nyelven, a leginkább érthető és minimális számú kifejezést.
Egy kis elmélet
Bármely dokumentumot a számítógépen vagy az interneten, mint mondtam, van tárolva bináris formában. Például, ha használja az ASCII karakterkészlet, a „K” betű lesz írva a 10001010 és a Windows 1251 alatt ez a szám rejt egy szimbólum - š. Ennek eredményeként, ha a böngésző, vagy a program címét egy másik asztalhoz, és úgy találja ASCII kódok helyett ablakok 1251, hogy az olvasó látni fogja a teljesen érthetetlen, hogy neki egy szimbólum.
A logikus kérdés, hogy mi az, hogy kitaláljon egy csomó táblákat a kódokat? A tény az, hogy amellett, hogy az orosz ábécé, és vannak angol, német, kínai. Egyes becslések szerint, körülbelül 200.000 karakter. Bár nem bízom ezekben a statisztikákban, gondoltam a japán.
Ne felejtsük el, hogy a felső és nagybetűket kell, hogy jöjjön fel a saját kódját, vannak vesszők, kötőjelek, és így tovább.
Minél több a szimbólum táblát, minél hosszabb a kódot minden őket, és ezért a súlya a dokumentum nagyobb lesz.
Képzeld el, ha egy könyvet nyomott 4 GB! Lenne egy nagyon hosszú ideig betölteni, azt elfoglalta az összes rendelkezésre álló helyet a számítógépen. A döntés, hogy a letöltést úgy tűnik, hogy nehéz.
Ezen okok miatt minden programozó egy időben megpróbálták felér egy szimbólum táblát. Annak érdekében, hogy kényelmesen használható és súlya maradt a legjobb.
A Microsoft például, az orosz nyelvű szegmensében a létrehozott windows-1251. Ez természetesen megvannak a maga előnyei és hátrányai. Mint bármely más termék.
Most már csak 2% -a az internetes oldalakon írt 1251. legtöbb webmester használja UTF-8. Miért?
Előnyök és hátrányok
UTF-8, ellentétben a windows-1251 kódolás egyetemes, tartalmaz betűket különböző ábécét. Van még egy UTF-128, ahol van egy általában minden nyelv - Theoule, szuahéli, Lao, a máltai és így tovább.
Az UTF-8 szegényebb, a betűk vegye fel a töredéke tér és elfoglalni csak egy bájtot, valamint a 1251. Az UTP azt a ritka karakter más nyelveken, vagy speciális karaktereket. Azt is mérlegelni 5-6 bájt, de a dokumentumban használt nagyon ritkán.
Ez kódoló gondolat, és mert ez használ a legtöbb alapértelmezett alkalmazásokat. Azaz, ha nem adja meg a programot, milyen kódolást használ, az első dolog, ellenőrzi az UTF-8.
Ehhez a következőket kell beilleszteni fej tag adatokat. Miután a karakter «charset =» jelentése vagy UTP vagy windose mint az alábbi példa.
Ha a későbbiekben módosítani kíván valamit, és helyezze be a kifejezést albán, a táblázat átiratát, akkor nem fog működni, mert a nyelvi kódolást nem támogatja. UTF-8 gond nélkül lehetővé teszi ezt.
Ha érdekli a létrehozásában a megfelelő hely, akkor tudom ajánlani a tanfolyam Mikhail Rusakov „létrehozása és támogatása helyszíni tól Z-ig”.
Én magam itt egy éve tanul az iskolában a bloggerek Alexander Borisov. Tart többször hosszabb, és a végéi nem látható, de nem kevésbé kimerítő és a tudományágak. Motivált, hogy fejlesszék tovább.
Nos, ha bármilyen kérdése van, nem kell nézni az interneten. Mindig van egy illetékes oktató.
Valami, elsétált a témában. Térjünk vissza a kódolás.
bázis fürdő
Amikor a PHP általában mind szörnyű. Már beszéltünk az adatbázis, használják őket, hogy gyorsítsák fel a munkaterületen. Általában, ha nem alkalmazzák őket, de ha szükségessé válik, hogy át a helyszínen, nincs egyedül.
Nehézségek történni egyáltalán nem számít, milyen a tapasztalata, szolgálati idő és a szolgálati idő. Egyes oldalak az adatbázisban tartalmazhatja az összes rendelkezésre álló karakterek windose-1251, a többi, például a oldalsablonok egy másik kódolást.
Bár nem szükséges átadni mindazt a munkát és a funkciók, de nem teljesen helyes. De miután mozgó kezdeni baj. Ideális esetben csak akkor ajánlott használni, vagy UTP vagy windose-1251, de valójában mindig minden esetben, itt vannak a hibái.
Ahhoz, hogy megállapodjanak a dekódolás írni mysql_query ( «SET NAMES cp1251»). Ebben az esetben az átváltási fognak végezni egy másik protokoll - cp1251.
Ha a helyszínen úgy dönt, hogy használja azt agresszíven 1251, akkor meg kell találni, vagy hozzon létre egy htaccess fájlt. Ő felelős a konfigurációt. Szükséges hozzá három sort minden jön össze.
DefaultLanguage ru; AddDefaultCharset windows-1251; php_value default_charset "cp1251"
Még mindig erősen ajánljuk, hogy gondoljon az UTF-8. Ő sokkal népszerűbb, egyszerű és gazdag. Bármi megoldás nem szedett már, fontos, hogy később is kijavítani. Add az angol nyelvű változata a honlapon ezen kódolás sokkal könnyebb lesz. Semmit nem kell korrigálni.
A döntés az Öné. Iratkozzon fel hírlevelünkre, hogy megtudja, a lehető leggyorsabban, hogy megteremtse a megfelelő oldalakon. ahol tanulni, hogy ne ismételjük meg a hibákat mások, valamint néhány blogger több látogatót.
Amíg a következő alkalommal, és sok sikert a törekvések.