Hogyan határozható meg gyorsan egy szövegszöveg kódolása?
Probléma volt: milyen gyorsan határozza meg az UTF-8-hoz képest egy szövegszöveg kódolását. A UNICODE kódolásán egyre szűkebben kell dolgoznia.
Az alábbiakban meg kell vizsgálni, hogy az UNICODE (UTF-8) kódolás WINDOWS kódolású (win-1251)
A funkció meglehetősen pontos választ nyújt, bár nem a kód alapú szimbólum leképezésen alapul.
Röviden - a function detect_my_utf () függvény leírása.- konvertálni (karakterlánc a speciális formátumba)
- kiszámítja a bejövő vonal hosszát
- adja meg a sztring minden betűjét a fővárosban
- eltávolítjuk a konkrét .0 és .1 kódokat
- számítsa ki az új vonal hosszát
- megkapjuk a stringek hányadát az újhoz
Ha ez a kapcsolat 1 vagy közel van hozzá, akkor gyanú merül fel, hogy a bejövő karakterláncot nem kódolták a UNICODE-ban. Ha ez az arány 1,2 és 2,2 között van, akkor biztonságosan újra kódolhatjuk a sort a WINDOWS encoding win-1251-ben.
A funkció kimenetén 0 vagy 1, illetve UNICODE vagy UNICODE.
Példák a függvényre:
4. példa Ez az algoritmus jól illeszkedik a különböző bejövő vonalakhoz a statisztikai szolgáltatás részeként a keresőmotorokról való navigáláshoz.
A PHP programozási nyelv a szkriptek használatán alapul. Ezt a nyelvet széles körben használják különféle front-end és back-end webes alkalmazások létrehozására. Alapvetően támogatja a legtöbb vendéglátó, aki a dinamikus interaktív webhelyek létrehozására szánt programnyelvek egyik vezetője.