Hogy gyorsan meg a kódolás a szöveget

Van egy probléma: hogyan lehet gyorsan meghatározni a karakterkódolást a karakterlánc tekintetében az UTF-8 Egyre gyakrabban kell dolgozni húrok UNICODE.

Az alábbiakban egy olyan funkció, hogy megvizsgálja, hogy szükség van a Unicode kódolás (UTF-8) kódoló WINDOWS (win-1251)

A függvény ad meglehetősen pontos választ, bár nem alapul egy-egy karakteres kódot átalakítás.

Rövid - leírás detect_my_utf () függvényt.
  • átalakítani (string egy speciális formátumban)
  • Kiszámítjuk a hossza a bemeneti vonal
  • Adunk az összes sort nagybetűvel
  • eltávolítás specifikus kódok és .0 .1
  • Kiszámítjuk a hossza az új vonal
  • Megkapjuk a vonatkozó új csomagoló gépsor

Ha ez az arány 1 vagy közel hozzá, akkor fennáll a gyanú, hogy része a szöveg nem kódolt UNICODE. Ha ez az arány tartományban 1,2-2,2 - akkor nyugodtan kódolni vonal WINDOWS kódoló win-1251.

A kimeneti függvény van 0 vagy 1, illetve nem UNICODE vagy UNICODE.

Példák a funkció:

4. példa Az algoritmus megbirkózik jól a különböző bemeneti karakterlánc részeként a szolgáltatás statisztikákat a keresőprogramok.

A víztelenítés víztelenítési mi www.arendanasosov.ru.

PHP - egy programozási nyelv használatán alapuló szkripteket. Ez a nyelv széles körben használják létrehozására különböző front-end és back-end webes alkalmazások. Támogatott alapértelmezés szerint a legtöbb házigazdák, hogy az egyik vezető programozási nyelvek létrehozására dinamikus, interaktív weboldalak.