Hogyan lehet webhelyet elérni a keresőmotorokhoz, kreatív módon projektekhez
- A webhely indexelését befolyásoló tényezők
- A webhely indexelésének kezelése
- megállapítások
Ebben a fejezetben megtudhatja, hogyan lehet elérni a megfelelő index CIÓ helyszínen, meg kell tennie, hogy a kereső vklyuchilastranitsy webhelye a rendelkezésre álló kereső, és hogyan kell kezelni az indexelés oldalak.
A webhely indexelését befolyásoló tényezők
Tól 1. fejezet, „Az ajánlatot és információt keresni az interneten,” tudod, hogy miért fontos, hogy a helyszínen megjelent a keresési eredményeket. Ehhez a keresőmotornak tartalmaznia kell a webhely oldalát az indexében. Az előző fejezetben olvasható keresőmotorról. Most beszéljünk arról, hogyan lehet a kereső robot szabadon indexelt webhely, valamint azt, hogyan lehet szabályozni a viselkedését kereső robot az interneten.
Meg tudjuk különböztetni azokat a tényezőket, amelyek jelentősen befolyásolják a webhely oldalainak indexelését, valamint a keresőmotorok keresési eredményeiben lévő dokumentumokhoz való linkek rangsorolását. Nézzük részletesen.
Ha egy HTML oldal nevében több szót szeretne használni, akkor háromféleképpen csatlakozhat hozzájuk: írj össze, elválasztva egy kötőjellel (-) vagy egy aláhúzásjelzővel (_).
Szerver szkript munkája
A szerver-szkriptek és webkiszolgáló beállítások munkája során sok olyan tényező rejtőzik, amelyek nagy hatást gyakorolnak egy webhely keresési robotok általi indexelésére.
HTTP fejlécek
Mindenekelőtt meg kell szervezni a kiszolgáló és a kiszolgáló szkriptjeit a HTTP fejlécekkel való együttműködéshez.
A HTTP protokoll az a nyelv, amelyben a kliens (például böngésző vagy bejáró) és a webhely szervere "beszél" kéréseken és válaszokon keresztül. A kiszolgálóhoz intézett minden kérelem esetén a böngésző vagy a robot a HTTP fejlécekben keresési információkat keres.
Az oldal változásának dátuma
Minél gyakrabban változik a webhelyén található információ, és új oldalakat adnak hozzá, annál gyakrabban fog a keresőmotor robotja a webhelyre. Tegyük fel, hogy tudjuk, hogy a webhelynek olyan oldalai vannak, amelyek nem változtak (például egy hírarchívum), és vannak frissített oldalak vagy teljesen újak. Fontos számunkra, hogy a keresőmotor friss oldalakat indexel, de a régi nem töltötte le újra. De a kereső nem tudja, mit tudunk.
Annak megértéséhez, hogy az oldal megváltozott-e a robot utolsó látogatása óta, a keresőmotornak újra le kell töltenie, és összehasonlítania az előző változattal. Ha az oldal értelmes változtatásokat tartalmaz, akkor az indexben lévő másolatát az új helyettesíti, ha nem, akkor az előzőleg tárolt változat az indexben marad. Kiderült, hogy a robot elfoglalja az olyan oldalakat, amelyek nem változtak meg, és az újnak nincs elég ideje. Amellett, hogy az új oldalak nem kerülnek be az indexbe, a nagy webhelyek egy másik problémával is szembesülhetnek - a szerveren való indokolatlan terhelés. Ennek elkerülése érdekében beállíthatja a kiszolgálót az oldalak létrehozásának és módosításának kezelésére. Ha ez a beállítás engedélyezve van, akkor amikor a kereső robot egy oldalt kér, a szerver tájékoztatja a robotot az oldal utolsó módosításának dátumáról. Ezután azokat a lapokat, amelyek nem változtak meg a robot utolsó érkezése óta, nem töltődnek le újra, és a robot nagyobb figyelmet fordít az új vagy megváltozott oldalakra.
Megmagyarázzuk, hogyan lehet beállítani az oldalváltozás dátumának feldolgozását.
Ünnepek és másolatok
Ha a webhely képes egy felhasználó (például egy fórum) regisztrálására, fontos, hogy valahogy emlékezzen, amikor utoljára volt a webhelyen, milyen oldalakat látogatott el, milyen beállításokat tett, stb. Ehhez van egy mechanizmus a munkamenetekhez - egyedi azonosítók az oldal látogatóinak számára.
Cookie - a felhasználó számítógépén tárolt speciális szövegsáv, amelyen keresztül minden webhely "megcímkézheti" a felhasználó böngészőjét. Amikor újra hozzáfér, a webhely elolvassa a cookie-értéket, és "felismeri" a felhasználót.
- www.site.ru/script.php?page=servicemode=show
- www.site.ru/service/
- www.site.ru/service.html
- www.site.ru/service.htm
Külön említésre méltó a Yandex mechanizmusa a másolatok eltávolítására: amikor a weblap azonos oldalainak száma elér egy bizonyos küszöbértéket, elindul egy speciális program, amely eltávolítja a felesleges oldalakat a keresőmotor indexéből. Néha egy ilyen eljárás után az index egyszerűen nem tartalmaz dokumentumokat a webhelyről, és az indexelési folyamat a kezdetektől indul.
Oldal kód
Az interneten található információk nagy része HTML formátumú szövegek. A weboldal HTML kóddal jelölt szöveg (a jelölés folyamata elrendezésnek nevezik). A keresőmotor, miután kiszivattyúzta az oldalt, elkezdi szétszerelni - a szöveget elkülöníteni a HTML-kódtól (olvassa el az előző fejezetben). Az oldal HTML-kódjának helyes összeállítása attól függ, hogy a robot pontosan hogyan indexeli az oldalt.
Ezenkívül a HTML kódlapok - az egyik fő belső tényező, amelyek fontosak a webhely oldalainak sikeres elhelyezése szempontjából a keresési eredmények között. A keresőmotorok megpróbálják felismerni a szöveg logikai struktúráját - a főcímeket, a logikai hangsúlyokat a legfontosabb szavakban. Ehhez a HTML-ben vannak speciális eszközök-címkék "