Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [PHP][MYSQL] Skrypt przeszukujacy zasoby internetu
dylesid
post
Post #1





Grupa: Zarejestrowani
Postów: 3
Pomógł: 1
Dołączył: 9.08.2008

Ostrzeżenie: (0%)
-----


Witam,

Pytanie z cyklu "jak sie do tego zabrac?". Chcialbym napisac skrypt, ktory uruchomiony, laczy sie z losowo wybrana strona WWW w jezyku polskim, pobiera zawartosc tekstowa strony tytulowej, ekstrahuje z niej losowo 10 wyrazow, a nastepnie wyswietla te slowa.

Jakies pomysly?

Losowanie adresu internetowego to chyba nie problem, trzeba by tylko okreslic pule (nie wiem, moze z http://www.proxyserverprivacy.com/ipaddress_range.php a moze sa inne prostsze sposoby). Ale co dalej, jak serwer ma sie laczyc i pobierac dane z wylosowanej strony. Czy to w ogole mozliwe?

Pozdr.,
Dylesid
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 3)
wookieb
post
Post #2





Grupa: Moderatorzy
Postów: 8 989
Pomógł: 1550
Dołączył: 8.08.2008
Skąd: Słupsk/Gdańsk




Curlem pobierzesz zawartość strony internetowej
-> http://php.net/curl


--------------------
Go to the top of the page
+Quote Post
dylesid
post
Post #3





Grupa: Zarejestrowani
Postów: 3
Pomógł: 1
Dołączył: 9.08.2008

Ostrzeżenie: (0%)
-----


Dzieki wielkie, o to mi chodzilo.

Z ciekawosci spytam jeszcze, czy to jest jedyny sposob, czy jest jakis inny, prowadzacy do osiagniecia tego celu? Oczywiscie mowimy o PHP, bo slyszalem, ze do tego typu zadan wyspecjalizowany jest Perl.
Go to the top of the page
+Quote Post
Riklaunim
post
Post #4





Grupa: Zarejestrowani
Postów: 640
Pomógł: 44
Dołączył: 8.02.2004

Ostrzeżenie: (0%)
-----


Python, Perl, PHP, Ruby, Java... można we wszystkim, kwestia co się umie i chce zastosować. Ogólnie musisz napisać demona/"serwer", który będzie odwiedzał strony (np wchodząc na jedną i wynajdując odnośniki do innych) - pobierał treść HTML (cURL), parsował zawartość, oceniał i zapisywał do bazy i przechodził do kolejnej strony ze znalezionych na parsowanej stronie odnośników winksmiley.jpg Skrypt odpalany nie jako strona www, a jako zwykły proces działający przed długi czasz (PHP-CLI).


--------------------
Biblioteki: Skrypty, CMS | Kurs PHP | Python
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 19.08.2025 - 11:02