![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 3 Pomógł: 1 Dołączył: 9.08.2008 Ostrzeżenie: (0%) ![]() ![]() |
Witam,
Pytanie z cyklu "jak sie do tego zabrac?". Chcialbym napisac skrypt, ktory uruchomiony, laczy sie z losowo wybrana strona WWW w jezyku polskim, pobiera zawartosc tekstowa strony tytulowej, ekstrahuje z niej losowo 10 wyrazow, a nastepnie wyswietla te slowa. Jakies pomysly? Losowanie adresu internetowego to chyba nie problem, trzeba by tylko okreslic pule (nie wiem, moze z http://www.proxyserverprivacy.com/ipaddress_range.php a moze sa inne prostsze sposoby). Ale co dalej, jak serwer ma sie laczyc i pobierac dane z wylosowanej strony. Czy to w ogole mozliwe? Pozdr., Dylesid |
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 640 Pomógł: 44 Dołączył: 8.02.2004 Ostrzeżenie: (0%) ![]() ![]() |
Python, Perl, PHP, Ruby, Java... można we wszystkim, kwestia co się umie i chce zastosować. Ogólnie musisz napisać demona/"serwer", który będzie odwiedzał strony (np wchodząc na jedną i wynajdując odnośniki do innych) - pobierał treść HTML (cURL), parsował zawartość, oceniał i zapisywał do bazy i przechodził do kolejnej strony ze znalezionych na parsowanej stronie odnośników (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg) Skrypt odpalany nie jako strona www, a jako zwykły proces działający przed długi czasz (PHP-CLI).
|
|
|
![]() ![]() |
![]() |
Aktualny czas: 3.10.2025 - 05:00 |