Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [PHP][MYSQL] Skrypt przeszukujacy zasoby internetu
dylesid
post
Post #1





Grupa: Zarejestrowani
Postów: 3
Pomógł: 1
Dołączył: 9.08.2008

Ostrzeżenie: (0%)
-----


Witam,

Pytanie z cyklu "jak sie do tego zabrac?". Chcialbym napisac skrypt, ktory uruchomiony, laczy sie z losowo wybrana strona WWW w jezyku polskim, pobiera zawartosc tekstowa strony tytulowej, ekstrahuje z niej losowo 10 wyrazow, a nastepnie wyswietla te slowa.

Jakies pomysly?

Losowanie adresu internetowego to chyba nie problem, trzeba by tylko okreslic pule (nie wiem, moze z http://www.proxyserverprivacy.com/ipaddress_range.php a moze sa inne prostsze sposoby). Ale co dalej, jak serwer ma sie laczyc i pobierac dane z wylosowanej strony. Czy to w ogole mozliwe?

Pozdr.,
Dylesid
Go to the top of the page
+Quote Post
wookieb
post
Post #2





Grupa: Moderatorzy
Postów: 8 989
Pomógł: 1550
Dołączył: 8.08.2008
Skąd: Słupsk/Gdańsk




Curlem pobierzesz zawartość strony internetowej
-> http://php.net/curl
Go to the top of the page
+Quote Post
dylesid
post
Post #3





Grupa: Zarejestrowani
Postów: 3
Pomógł: 1
Dołączył: 9.08.2008

Ostrzeżenie: (0%)
-----


Dzieki wielkie, o to mi chodzilo.

Z ciekawosci spytam jeszcze, czy to jest jedyny sposob, czy jest jakis inny, prowadzacy do osiagniecia tego celu? Oczywiscie mowimy o PHP, bo slyszalem, ze do tego typu zadan wyspecjalizowany jest Perl.
Go to the top of the page
+Quote Post
Riklaunim
post
Post #4





Grupa: Zarejestrowani
Postów: 640
Pomógł: 44
Dołączył: 8.02.2004

Ostrzeżenie: (0%)
-----


Python, Perl, PHP, Ruby, Java... można we wszystkim, kwestia co się umie i chce zastosować. Ogólnie musisz napisać demona/"serwer", który będzie odwiedzał strony (np wchodząc na jedną i wynajdując odnośniki do innych) - pobierał treść HTML (cURL), parsował zawartość, oceniał i zapisywał do bazy i przechodził do kolejnej strony ze znalezionych na parsowanej stronie odnośników (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg) Skrypt odpalany nie jako strona www, a jako zwykły proces działający przed długi czasz (PHP-CLI).
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 23.08.2025 - 18:46