Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Parsowanie strony - lista
sebax3x
post
Post #1





Grupa: Zarejestrowani
Postów: 43
Pomógł: 0
Dołączył: 8.03.2008

Ostrzeżenie: (0%)
-----


Chciałbym zrobić ranking użytkowników z serwisu wrzuta.pl (kto ile plików dodał, jakie) i mam problem, muszę pobrać listę wszystkich użytkowników - ma ktoś pomysł jak to można zrobić?
Ranking ten służyłby późniejszemu zaznaczaniu użytkowników, którzy nielegalnie rozprowadzają moje piosenki w tym serwisie - jak wiadomo zgłaszanie wszystkich piosenek pojedynczo mija się z celem.
Dodam, ze mój zespół traci przez wrzutę i inne serwisy tego typu bardzo dużo, pewnie nie tylko ja mam z tym problem - pisałem do wrzuty w tej sprawie, jednak oni nie chcą kasować wszystkich plików z nazwą mojego zespołu w tytule ponieważ nie leży to w ich kompetencjach.
Dziękuję serdecznie za okazaną pomoc - oczywiście mile widziane są także rozwiązania w innych językach programowania.
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
sebax3x
post
Post #2





Grupa: Zarejestrowani
Postów: 43
Pomógł: 0
Dołączył: 8.03.2008

Ostrzeżenie: (0%)
-----


Właśnie tak próbowałem, niestety google blokuje przed curlem (i file_get_contents) pokazuje tylko kilka stron wyników,
zespół który reprezentuję jest dość popularny - dodatkowo taki program służyłby nie tylko mi. Najlepiej jakby na bieżąco aktualizował listę użytkowników - dodam, że próbowałem parsować serwis wrzuta.pl - ale on bardzo szybko blokuje ip (gdy parsuje się wyniki wyszukiwania), co jest zresztą zrozumiałe z ich polityką - powstaje wiele wyszukiwarek "opartych na wrzucie". Pewnie trzeba stworzyć jakiś system (bota?) który przeszukiwałby kolejne strony serwisu i zapisywał unikalnych użytkowników do tablicy (skrypt sprawdzający zawartość katalogu użytkownika już mam).
Go to the top of the page
+Quote Post
Fifi209
post
Post #3





Grupa: Zarejestrowani
Postów: 4 655
Pomógł: 556
Dołączył: 17.03.2009
Skąd: Katowice

Ostrzeżenie: (0%)
-----


Cytat(sebax3x @ 23.03.2010, 14:13:53 ) *
Właśnie tak próbowałem, niestety google blokuje przed curlem (i file_get_contents) pokazuje tylko kilka stron wyników,
zespół który reprezentuję jest dość popularny - dodatkowo taki program służyłby nie tylko mi. Najlepiej jakby na bieżąco aktualizował listę użytkowników - dodam, że próbowałem parsować serwis wrzuta.pl - ale on bardzo szybko blokuje ip (gdy parsuje się wyniki wyszukiwania), co jest zresztą zrozumiałe z ich polityką - powstaje wiele wyszukiwarek "opartych na wrzucie". Pewnie trzeba stworzyć jakiś system (bota?) który przeszukiwałby kolejne strony serwisu i zapisywał unikalnych użytkowników do tablicy (skrypt sprawdzający zawartość katalogu użytkownika już mam).


No dokładnie, musiałbyś mieć bota który chodzi po stronie i zapisuje użytkowników unikalnych.
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 14.10.2025 - 15:59