Kereső robotok, kreatív módon projektek

  • Meghatározások és terminológia
  • A nevét a robotok
  • Egy kis történelem
  • Mit jelentenek a keresőrobotok
  • A viselkedés a robotok interneten
  • robot vezérlés
  • megállapítások

Mi keresőrobotok? látnak, milyen funkciót? Mik a jellemzői a helyszín a keresőmotorok? Mypostaraemsya itt, hogy válaszoljon ezekre a kérdésekre működésével kapcsolatos robotok.

Meghatározások és terminológia

Az angol, van több lehetőség bejárók nevek: robotok, web botoktól, csúszómászó, pókok; A magyar nyelv valójában fogott egy kifejezés - a robotok, vagy rövidített formában - védjük.

A honlapon www. robotstxt. org kap a következő definíciót robotok:

„Web robot - egy program, amely megkerüli a WWW hypertext Rekurzívan lekérdező és visszakeresésére dokumentumokat.”

Imenarobotov

A legtöbb kereső robotok saját egyedi neve (kivéve azokat a robotokat, amelyek valamilyen okból van álcázva a felhasználó böngészőjének).

A név a robot látható a User-agent szerver log fájlok, szerver statisztikai rendszerek jelentések, valamint az oldalakon a keresők.

Nemnogoistorii

Még a nevét a fő robot Yandex megtalálja visszhangja időkben: egy töredéke a teljes nevét «kompatibilis; Win16; »adtunk kompatibilitás néhány régebbi webszerverek.

Chtodelayutrobotypoiskovyhsistem

Milyen funkciókat hajthat végre a robotok?

A kereső működik, több robot, mindegyiknek megvan a célra. Íme néhány a feladatokat a robotok:

Példaként a lista Yandex robotok. Yandex használ többféle robotok különböző funkciókat. Azonosítani azokat lehet a User-agent karakterláncot.

  1. Yandex / 1.01.001 (kompatibilis; Win 16; I) -A fő indexelő robot.
  2. Yandex / 1.01.001 (kompatibilis; Win 16; P) -indeksator képek.
  3. Yandex / 1.01.001 (kompatibilis; Win 16; H) -robot állított, opredelyayuschiyzerkala oldalakon.
  4. Yandex / 1.03.003 (compatible; Win 16; D) -robot állított, obraschayuschiysyak oldal hozzáadásával keresztül egyfajta „Add URL».
  5. Yandex / 1.03.000 (kompatibilis; Win 16; M) - robot obraschayuschiysyapri nyissa meg az oldalt a link "talált kifejezést."
  6. YandexBlog / 0.99.101 (compatible; DOS3.30 Mozilla / 5.0; B; robot) - a robot indexelés xml-fájlok blogkereső.
  7. YandexSomething / 1.0 - egy robot, indexelés hírek folyik partnerek Yandeks.Novosti és robotok fájlokat. txt, hogy megtalálják a robot blog.

Emellett Yandex működik, több ellenőrző robot - „just-kivalok”, amely csak akkor ellenőrzi a rendelkezésre álló dokumentumokat, de nem indexeli.

Mégis, a leggyakoribb robotok - amelyek keresésének, befogadásának és archív dokumentumok további feldolgozásra más kereső mechanizmusok. Célszerű külön a robot indexelő.

A viselkedés a robotok interneten

Az eltérő viselkedését a robot honlapján a viselkedés az átlag felhasználó?

Nézhet HTML-oldal a robot szeme, nem tudjuk, de próbáljuk meg elképzelni, hogy le van tiltva a böngészőjében kijelzőn grafika és stílus.

Így elmondható, hogy a keresőmotor pókok index pumpálnak a HTML-oldal felépítése, de anélkül, hogy a design elemek és képek nélkül.

robot vezérlés

Hogyan lehet egy webmester lehet szabályozni a viselkedését kereső robotok a honlapon?

Azonban a fő kereső robotok követi a szabályokat a kivételek, sőt azokat a terjeszkedés.

A különleges utasításokat a robots.txt fájlt. és speciális meta-tag robotok részletesen 6. fejezet, „hogyan lehet a webhely elérhető a keresőmotorok.”

Ellenőrző látogatásokat a keresőprogramok és lehet közvetett módon, például a Google kereső robot gyakran újra felvenni a dokumentumokat, amelyeken számos kapcsolatot más oldalakon.

Robots - szükséges és nagyon fontos része a keresőmotorok. Ha be a kereső, mint egy „fekete doboz”, ahol a kérdés a keresési eredmények - az „output” a rendszer, akkor a keresőmotor pókok - az „input”, amely fogadja a dokumentumokat.

Ha helyesen benyújtja az oldalakat a „bejárat”, szabályozza a viselkedését a robot képes elérni a legjobb eredményt az indexálás - periodicitás, a teljesség és a jobb helyezést.

Kapcsolódó cikkek