Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [PHP] sprawdzanie czy na stronie jest dany ciag znakow
Forum PHP.pl > Forum > Przedszkole
matyskiewicz
witam,
czy w php mozna napisac program, ktory umozliwi mi znalezienie zdefiniowaneg ciagu znakow np: <div id="abc"></div>, po wejsciu na strone. wazne by program przeszukal nie tylko strone glowna ale rowniez podstrony wewnatrz domeny.

tj majac strone firmowa pod adresem example.com program przeszykalby wszystkie 5 zakladek w celu znalezienia kawalka kodu.

do realizacji potrzebne bylyby funkcje:
- przeszukiwanie wszystkich podstron w domenie
- przeksztalcenie strony na kod html

prosze o wskazanie pomocnych funkcji
worek
JavA, Ewentualnie przeszukanie plików ze skryptami biggrin.gif, Lub ereg jeżeli masz te pliki ze skryptami w osobnych plikach zapisane i znasz ich lokalizację
peter13135
1. file_get_contents() lub curl do pobrania strony
2. wyrażenia regularne (preg_match_all np.) do szukania linków do podstron i szukanych treśći
3. właściwie, za pomocą php programu nie napiszesz, tylko skrypt i w przypadku większej ilości podstron taki skrypt mógłby być zawodny. Program napiszesz w c/c++/c#/java/delphi i wielu innych językach "kompilowanych"


@up. ereg wyszło już z mody wink.gif
matyskiewicz
Cytat(peter13135 @ 26.07.2011, 17:40:03 ) *
1. file_get_contents() lub curl do pobrania strony

1:0 smile.gif
  1. $uchwyt = curl_init( 'http://php.pl/' );
  2. curl_setopt( $uchwyt, CURLOPT_USERAGENT, 'Mozilla/5.0 (X11; U; Linux i686; pl; rv:1.8.0.3) Gecko/20060426 Firefox/1.5.0.3' );
  3. curl_setopt( $uchwyt, CURLOPT_REFERER, 'http://www.google.pl' );
  4. curl_setopt( $uchwyt, CURLOPT_RETURNTRANSFER, 1 );
  5. $page = curl_exec($uchwyt);
  6. curl_close($uchwyt);
  7. echo '<pre>';
  8. echo '</pre>';


2:0
  1. preg_match_all('/<a.*href=\"([^\"]*)\".*>(.*)<\/a>/iU', $page, $links);
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.