PHP Manual, funkció több byte sorban
Sok nyelv, a karakterek lehet kifejezni egy bájt. Multi-os karakterkészlet kódokat használják, hogy kifejezzék a karakterek sok más nyelven.
mbstring úgy tervezték, hogy a japán karaktereket. Azonban sok mbstring funkciók nem működnek más kódolásokat, nem csak a japán.
Multi-byte karakterkódoláshoz jelentése egyetlen karakter több egymást követő bájt. Néhány kódolás van műszak (escape) olyan szekvenciák a rajt / cél vonal bájtos karaktereket. Következésképpen a több-bájtos sor eltörhet a szétválasztás és / vagy a számítástechnikában a ha nem használ megbízható módszer kódoló bájtos karaktereket. Ez a modul funkcióit, hogy mentse a sok bájtos karakterek és egyéb kiegészítő funkciók, mint például átváltás.
A PHP alapvetően tervezték ISO-8859-1, néhány multi-byte kódolás nem működnek a PHP. Ezért fontos megállapítani mbstring.internal_encoding kódolására, dolgozó PHP.
Karakterkódolás Követelmények PHP4
egyetlen bájtos karakterek tartományban 00h-7FH. amely kompatibilis az ASCII
Multi-byte kódolás - jelentése 00h-7FH tartományban
Íme néhány példa a belső karakterkódolást, ami működik, és nem működik a PHP.
karakterkódolás nem működik a PHP, lehet konvertálni a konverziós HTTP-bemeneti / mbstring modul kimenete.
Megjegyzés: SJIS nem használható belső kódolás, hacsak az olvasó nem ismeri a kérdéseket is elegendő munkát elemző / fordító, és a karakterkódolás.
Megjegyzés: Ha egy adatbázis PHP, ajánlott, hogy az egyik karakterkészletet az adatbázis és a belső kódoló / intra kódolt a könnyű használat és a termelékenység növelése.
Ha használja a PostgreSQL, hogy támogatja a karakterkódolás, amelyek eltérnek a backend-kódolás. Lásd. PostgreSQL részletek a könyvben.
mbstring kiterjesztése modult. Ön köteles csatlakozni a script configure. Lásd. Telepítés részletesen a következő részben.
A következő konfigurációs beállítás kapcsolódik a modul mbstring:
--enable-mbstring. Ez magában foglalja mbstring funkciókat. Ez a beállítás szükséges használni mbstring-funkciókat.
--enable-mbstr-ENC-trans. Ez magában foglalja a karakterkódolás átalakítás HTTP-input-használó gépek mbstring átalakítás. Ha ez a funkció engedélyezve van, kódolás HTTP karakteres bemenet automatikusan át mbstring.internal_encoding.
Conversion kódolás HTTP-I / O jelek is konvertálni a bináris adatok. A felhasználók arra ösztönzik, hogy ellenőrizzék karakterkódolás konverziót, ha bináris adatot használnak input / output HTTP.
Ha enctype HTML-formanyomtatványok multipart / form-data. mbstring nem konvertálja karakterkódolás POST-adatokat. Ha igen, akkor a húr kell alakítani a belső karakterkódolást.
Nincs rá mód, hogy ellenőrizzék a HTTP-bemenet a PHP-script konverziós karakterek. Kikapcsolni a HTTP-konvertáló bemeneti karakterek itt php.ini.
1. példa letiltása HTTP-konvertáló a bemeneti szimbólumok php.ini
Jelenleg mbstring modul támogatja a következő karakterkódolást. Karakterkódolás megadható paraméter kódoló mbstring modul funkciói.
Itt kódolások által támogatott kiterjesztés PHP:
A bejegyzést a php.ini-ben. részesülő kódolás nevét, és elfogadja, az „auto” és „pass”.
mbstring függvények figyelembe kódolás nevét, fogadja el és az „auto”.
Ha a „pass” van beállítva, nincs karakterkódolás átalakítás nem történt meg.
Ha az "auto" van beállítva, akkor bővült "ASCII, JIS, UTF-8, EUC-JP, SJIS".
Lásd. Szintén mb_detect_order ()
Megjegyzés: „Támogatott karakterkódolás” nem jelenti azt, hogy úgy működik, mint a belső jellegű kódot.
telepítés php.ini
mbstring.internal_encoding meghatározza a belső, alapértelmezett kódolás szimbólumok
mbstring.http_input határozza meg az alapértelmezett karakterkódolást a HTTP-bemenet
mbstring.http_output meghatározza az alapértelmezett kódolást HTTP-jellegű kiadási
mbstring.detect_order határoz meg eljárást meghatározó alapértelmezett karakterkódolást. Lásd. Szintén mb_detect_order ()
mbstring.substitute_character meghatározza szimbólumok helyettesíti a hibás karakterkódolásokat
Böngészők arra ösztönzik, hogy ugyanazt a kódolást, ha elküldi az adatokat. De böngészők nem használhatja ugyanazt a karakterkódolást. Lásd. Mb_http_input (), hogy meghatározza a böngésző kódolás.
Ha enctype beállítása multipart / form-data értéket a HTML-űrlapok, mbstring nem konvertálja karakterkódolás POST-adatokat. A felhasználó köteles megtenni a forgatókönyvet, ha a konverzió van szükség.
Egyidejűleg böngészők púpozott elég meghatározni a karakterkódolást HTML-ben. charset jobb telepíteni a HTTP-fejléc / fejlécet. Default_charset megfelelően változnak a karakterkódolást.
4. példa Növények php.ini
A tárolásához jel használható akár 6 bájt.
Multi-os karakterkészlet általában kétszer olyan széles, mint egy byte-os. Szélesebb karakterek úgynevezett „zen-kaku” - ami azt jelenti, „teljes szélesség”, szűkebb úgynevezett „han-kaku” - ami azt jelenti, „fél-szélesség”. „Zen-kaku” általában egy fix szélességű.
Néhány kódolás határozza műszak (escape) szekvenciája az input / output / a több-bájtos vonalak.
ISO-2022-JP követelmény, hogy a használt SMTP / NNTP.
"I-mode" web-site, hogy lehet használni, hogy SJIS.
Információk a szimbólumok japán / koreai / kínai