![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
![]() Grupa: Zarejestrowani Postów: 43 Pomógł: 0 Dołączył: 8.03.2008 Ostrzeżenie: (0%) ![]() ![]() |
Chciałbym zrobić ranking użytkowników z serwisu wrzuta.pl (kto ile plików dodał, jakie) i mam problem, muszę pobrać listę wszystkich użytkowników - ma ktoś pomysł jak to można zrobić?
Ranking ten służyłby późniejszemu zaznaczaniu użytkowników, którzy nielegalnie rozprowadzają moje piosenki w tym serwisie - jak wiadomo zgłaszanie wszystkich piosenek pojedynczo mija się z celem. Dodam, ze mój zespół traci przez wrzutę i inne serwisy tego typu bardzo dużo, pewnie nie tylko ja mam z tym problem - pisałem do wrzuty w tej sprawie, jednak oni nie chcą kasować wszystkich plików z nazwą mojego zespołu w tytule ponieważ nie leży to w ich kompetencjach. Dziękuję serdecznie za okazaną pomoc - oczywiście mile widziane są także rozwiązania w innych językach programowania. |
|
|
![]()
Post
#2
|
|
![]() Grupa: Zarejestrowani Postów: 4 655 Pomógł: 556 Dołączył: 17.03.2009 Skąd: Katowice Ostrzeżenie: (0%) ![]() ![]() |
Nie mam konta na wrzucie ale nie widzę opcji listowania wszystkich użytkowników serwisu.
Może poprosisz google o pomoc? ![]() Wpisz w google coś takiego (dla przykładu nirvana): nirvana site:wrzuta.pl Następnie odczytaj ile stron zostało znalezionych, później jeden po drugim wyłap z wyników google i wrzuć do siebie do tablicy, następnie możesz zrobić automatyczne raportowanie przez np. curl -------------------- Zainteresowania: C#, PHP, JS, SQL, AJAX, XML, C dla AVR
Chętnie pomogę, lecz zanim napiszesz: Wujek Google , Manual PHP |
|
|
![]()
Post
#3
|
|
![]() Grupa: Zarejestrowani Postów: 43 Pomógł: 0 Dołączył: 8.03.2008 Ostrzeżenie: (0%) ![]() ![]() |
Właśnie tak próbowałem, niestety google blokuje przed curlem (i file_get_contents) pokazuje tylko kilka stron wyników,
zespół który reprezentuję jest dość popularny - dodatkowo taki program służyłby nie tylko mi. Najlepiej jakby na bieżąco aktualizował listę użytkowników - dodam, że próbowałem parsować serwis wrzuta.pl - ale on bardzo szybko blokuje ip (gdy parsuje się wyniki wyszukiwania), co jest zresztą zrozumiałe z ich polityką - powstaje wiele wyszukiwarek "opartych na wrzucie". Pewnie trzeba stworzyć jakiś system (bota?) który przeszukiwałby kolejne strony serwisu i zapisywał unikalnych użytkowników do tablicy (skrypt sprawdzający zawartość katalogu użytkownika już mam). |
|
|
![]()
Post
#4
|
|
![]() Grupa: Zarejestrowani Postów: 4 655 Pomógł: 556 Dołączył: 17.03.2009 Skąd: Katowice Ostrzeżenie: (0%) ![]() ![]() |
Właśnie tak próbowałem, niestety google blokuje przed curlem (i file_get_contents) pokazuje tylko kilka stron wyników, zespół który reprezentuję jest dość popularny - dodatkowo taki program służyłby nie tylko mi. Najlepiej jakby na bieżąco aktualizował listę użytkowników - dodam, że próbowałem parsować serwis wrzuta.pl - ale on bardzo szybko blokuje ip (gdy parsuje się wyniki wyszukiwania), co jest zresztą zrozumiałe z ich polityką - powstaje wiele wyszukiwarek "opartych na wrzucie". Pewnie trzeba stworzyć jakiś system (bota?) który przeszukiwałby kolejne strony serwisu i zapisywał unikalnych użytkowników do tablicy (skrypt sprawdzający zawartość katalogu użytkownika już mam). No dokładnie, musiałbyś mieć bota który chodzi po stronie i zapisuje użytkowników unikalnych. -------------------- Zainteresowania: C#, PHP, JS, SQL, AJAX, XML, C dla AVR
Chętnie pomogę, lecz zanim napiszesz: Wujek Google , Manual PHP |
|
|
![]()
Post
#5
|
|
![]() Grupa: Zarejestrowani Postów: 43 Pomógł: 0 Dołączył: 8.03.2008 Ostrzeżenie: (0%) ![]() ![]() |
Próbowałem coś takiego napisać, ale już rozkładam ręce - są użytkownicy do których praktycznie nikt nie linkuje. Próbowałem też korzystać z istniejących technologii wykorzystywanych min. przez serwis filestube.com - sphinx search engine, ale wydaje mi sie to strasznie skomplikowane. Zainstalowałem tez sphider search php - ale działa on bardzo wolno i szuka nieco "bezsensownie w kółko".
Jak twoim zdaniem najoptymalniej byłoby stworzyć bota - ja próbowałem "latać" po linkach do podobnych utworów, ale po pierwsze w końcu taki bot się zapętla, a po drugie to strasznie nieoptymalne. Może jesteś na tyle biegły aby w jakiś sposób wylistować (xml?) tę listę, bo nie wierzę, żę nie ma takiej opcji, chociażby dla google bota. |
|
|
![]()
Post
#6
|
|
Grupa: Zarejestrowani Postów: 99 Pomógł: 9 Dołączył: 9.09.2008 Ostrzeżenie: (0%) ![]() ![]() |
Zawsze można spróbować znaleźć artykuł na pozwanie ich do sądu :]
Myślę, że to dałoby się jakoś zrobić. |
|
|
![]()
Post
#7
|
|
![]() Grupa: Zarejestrowani Postów: 4 655 Pomógł: 556 Dołączył: 17.03.2009 Skąd: Katowice Ostrzeżenie: (0%) ![]() ![]() |
To tak przemyślałem temat...
![]() Tworzysz sobie bazę danych w moim przypadku o nazwie: wrzuta A w niej tabelę: users
Plik php wygląda tak:
Obok pliku php tworzysz sobie plik bat (zakładam że jesteś na windowsie) W moim przypadku wygląda on tak: Kod @ECHO OFF :start php wrzuta.php goto start Może się zmienić ścieżka do php (możesz nie mieć dodanego w zmiennych środowiskowych) i nazwa pliku. Teraz idąc dalej stworzyłem kod, który wykonuje to zadanie troszkę szybciej
Ten post edytował fifi209 25.03.2010, 00:25:40 -------------------- Zainteresowania: C#, PHP, JS, SQL, AJAX, XML, C dla AVR
Chętnie pomogę, lecz zanim napiszesz: Wujek Google , Manual PHP |
|
|
![]() ![]() |
![]() |
Wersja Lo-Fi | Aktualny czas: 15.08.2025 - 03:30 |