Elemzési oldalaira (html-tartalom) a php

Elemzési oldalaira (html-tartalom) php.

Megjegyzés szentelt elemzés, különösen oldalak elemzés, értelmezés oldalak, elemzés webes környezetben, elemzés a html-tartalom helyén.

A fejlesztés során a különféle webes szolgáltatások szükséges nagyon gyakran szembesülnek azzal a feladattal, amelyben meg kell, hogy gyorsan különféle információk nagy mennyiségben. Ez elsősorban annak köszönhető, hogy a megragadása, lopás információk, amennyit akar nevezni. Az a tény, hogy az információ hozzáférhető és nyitott. Elemzési funkció - gyors és automatizált adatgyűjtés, a tartalom az oldalon.

Most nagyon népszerű elemezni webes környezetben, vagyis feldolgozni oldalon, amely tartalmazza legalább néhány érték és az ember szempontjából. Különleges érték a katalógusban, beleértve a képeket, referencia adatbázisok, és még sok más, amelyek hasznosak lehetnek a versenytársak.

Próbáljuk Spars szükséges információt html, meg kell kérni a hivatkozásokat tartalmaz, a honlapon.

Meg akarom mutatni két alapvető módja annak, hogy a tartalmat a honlapon:

1. lehetőség - PHP függvény file_get_contents. A függvény egy html-line fogjuk elemezni a linkek:

2. lehetőség - göndör. Könyvtár, amely támogatja a php és egy nagy számos beállítás, a POST-kérés dolgozni FTP. Vegyünk egy hagyományos hívást curl könyvtárat, amely megadja nekünk a tartalom az oldalon:

Most, a vonal $ ki a tartalma mindhárom oldala. Tehát közvetlenül a string elemzés.

Ismételten szeretném megmutatni 3 lehetőség megoldani a problémát, „natív” módja annak, hogy php, a beépített könyvtárból és DOMDocument SimpleHTMLDOM könyvtárban.

1. php függvény felrobban. Funkció megtalálja a kívánt karaktert vagy egy részét egy string, és elválasztja az egész string tömb elemeit.

Ismét meg kell, hogy az érték a href attribútum tag egy, az adott osztozik egy közös vonal egyes részein \ szegmens:

Ha a nyomtatási mi tömb hasonló a következő:

2. A beépített könyvtárból DOMDocument. Munka osztály körülbelül a következő:

Az eredmény egy ilyen kódot pontosan ugyanaz, mint a felrobban funkciót.

3. SimpleHTMLDOM könyvtárban. Meg kell csatlakoztatni a fájlból. Kerülő hasonló DOMDocument. Együtt dolgozunk az osztály:

Ismét, az eredmény egy tömb pontosan ugyanaz, mint a fenti a fenti két.