Mi határozza meg a kódolást az internetes oldal

Php kezdőknek

A kérdés nem tétlen, a tény az, hogy amikor a kódolás kifejtettek a szervezetben a HTML dokumentum

nincsenek problémák. De néha az alkotók oldalak nem írok metatagekben oldal kódolását, hogy hogyan lehet ebben az esetben, és hogyan kell tanulni a kódoló ezeket az oldalakat. Lássuk, hogyan interent. A böngésző elküldi a kérést a szerver oldalak úgynevezett Heder, a szerver válaszol a böngésző az azonos héderben majd ad egy oldalt HTML formátumban. Mi Heather - műszaki adatok, amelyeket a böngésző és a szerver csere, és nem jelennek meg a felhasználó, mint a normál esetben nem szükséges. A böngésző olvasni Heder, megérti, mit kell tennie, és gyárt HTML oldalt a szokásos módon. De amikor letölt ez az oldal, mint egy robot, mint ez:

A böngésző ebben az esetben nem használható, és ezért nem lehet meghatározni az egyszerű módszerek, mint például kódolás a letöltött oldal, mert néha nem ír kódolást. Nézd néz ki, mint Heather, amelyet elküld a böngészőnek.

Az összes eith vonalak felhívni a figyelmet, hogy csak egy: Content-Type: text / html; charset = windows-1251. Láthatjuk, hogy ez van írva kódolást. Milyen típusú kódolást? Ez kódolása az alapértelmezett kiszolgáló (rendszergazda által beállított a szerver, attól függően, hogy, milyen kódolást elsősorban oldalak ezen a szerveren). Azaz, ha az oldal kódolását nincs megadva a HTML szöveget, amíg a böngésző azt Hadera a szerverről, a vonal, amit láttunk. Előfordul, hogy a webhely készítője maga küldi kódolás Hadera, és kiírja a HTML dokumentumban (például az oldalunkon nincs fogalma a kódolás, a Coca-kódolt beállítva a robot vagy a böngésző ezen mondtuk neki, hogy térjen vissza a lapok, hogy az, amit te akar, mint a kódolás és letölthető honlapunkon). És miért nem az alkotó a webhely regisztrálja azt a HTML szöveget? Nem szükséges regisztrálni, ha a kódolás a helyszínen egybeesik a kódoló az alapértelmezett szerver, a böngésző megjelenít egy normális oldal. És végül, ez a hegy nem is tudom, mi az alkotó a honlapon is problémákat okozott keresők, nos, nekünk veled. Egyszerű módon nem tudjuk a kódolást. Heder elkülönül a HTML szöveget karakter \ r \ n \ r \ n.

Heather \ r \ n \ r \ n Itt HTML oldalt.

// függvényfejlécben ága az oldal
függvény return_data ($ path) <
$ Oldal = "";
$ Arr = felrobban ( "\ r \ n \ r \ n", $ path);
$ Heder = $ arr [0];
while (list ($ kulcs. $ ertek) = @each ($ tomb)) <
if ($ key == '0')
. $ Oldal = $ ertek "\ n" .;
>
return array ($ heder $ oldalon.);
>

// csatlakozni funkció CURL
függvény ext_dll ($ path) <
$ Bibl_ext = könyvtárnév ($ _SERVER [ 'SCRIPT_FILENAME']). "/ Extensions / php_". $ PATH "Dll.";
if (! @extension_loaded ($ path) és is_file ($ bibl_ext)) <@dl ("php_". $path .".dll");>
if (! @extension_loaded ($ path))
return true;
>
$ Curl_return = ext_dll (curl);

// $ tomb ay [0] - egy oldal fejlécében
$ Heder = $ arr ay [0];
// $ tomb ay [1] - az oldal maga
$ Oldal = $ arr ay [1];

// megtanulják a kódolást a header
if (preg_match ( "

i”, $ heder. $ tomb r)) <$ch arset _heder = trim ( $arr r [ 1 ] );>
// megtanulják a kódolást az oldal
if (preg_match ( "

// függvény oldal fordítást windows-1251 kódolás
függvény replace_page ($ ch Arset. $ path) <
if (preg_match ( "

Kapcsolódó cikkek