Synapse nativexml
Ha az előző poszt egyedüli célja, hogy „Pingovalka” felhasználóval a program, ezt - a fejlesztők számára. Ma fogunk foglalkozni a sitemap.xml.
Általában sitemap hasznos lehet szinte semmit, kezdve attól, hogy képes csak kap egy listát az összes oldalak, valamint például, hogy egy listát a további Spars oldalcímekre ellenőrizze az indexelést keresők, stb Ismerve az elérési utat a sitemap, akkor megment egy csomó időt, hogy megszerezze a szükséges információt az oldalon.
Amint az a cím a poszt - használata lesz két szabad, cross-platform könyvtár - a Synapse és NativeXML.
Mielőtt rátérnénk a végrehajtását olvasható sitemap Delphi. egy kis üzletet a tény, hogy mi vár.
Néhány szó a Webhelytérkép
Sitemap használunk annak érdekében, hogy a keresők feltérképezése hatékonyabb az oldalon.
Például egy URL bejegyzés meta-adatok a következőképpen nézhet ki:
Ha egy webhely többé-kevésbé régi, akkor összesen több ezer Sitemap URL. Például oldaltérkép blogomban most szám 865 oldal, beleértve oldalakat címkéket. És ha némi varezniki ahol frissítések folyhat 100 darab naponta? Vagy elősegíteni népszerű fórum? Van oldaltérkép számíthat elég az oldalak számát. Ezért a fejlesztők tett a Webhelytérkép protokoll korlátozás - 50000 URL egy fájlba. Továbbá, a fájlt kell a 10 MB.
Ha az adatokat továbbítani 50000+ oldalt, a kereső megy Index Sitemap. Ez a lista a fale útvonalát XML-fájlok, amelyek már URL „s oldalakat felvétel az index fájlt a következőképpen nézhet ki .:
Minden adat Webhelytérképének kerülnek továbbításra UTF-8. Itt talán az összes információt, amit kell, hogy dolgozzon. Most viszont, hogy a végrehajtás a mi programot.
Pars Sitemap Delphi
Írjon egy kis programot, ami nem lesz kérdés, hogy töltse le és elemzi a sitemap bármilyen - mint az index fájlt, és nélküle. Ehhez először meghatározzuk az algoritmus kicsit. A munka a következő lesz:
- Töltse le a fájlt egy URL-t
- Azt olvassuk a fájlt, és meghatározza, hogy az index
- Ha letöltöttük az index sitemap, akkor kap belőle linkek más fájlokat és letölteni ezeket a fájlokat
- Pars a letöltött fájlokat információt az URL-t.
Kezdjük egy leírást a szükséges adattípusok. Minden elem a sitemap kerül bemutatásra formájában felvétel (record):