Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [curl] szukanie wgłąb strony
PawelC
post
Post #1





Grupa: Zarejestrowani
Postów: 1 173
Pomógł: 121
Dołączył: 24.09.2007
Skąd: Toruń

Ostrzeżenie: (0%)
-----


witam (IMG:http://forum.php.pl/style_emoticons/default/smile.gif)
problem polega na tym napisałem sobie w php, robota sieciowego i szuka on tego co chcę jednak tylko na stronie głównej, jak zrobić w php aby robot wszedł po linkach wgłąb strony. Prosiłbym o jakieś wskazówki, i jeżeli to możliwe jakiś przykład.

offtop Jaki język według was jest najlepszy do napisania robota sieciowego?
Cytat
Pająk powinien być widoczny
Kolejnym dobrym sposobem zapewnienia, że inni będą wiedzieli o naszym pająku, jest
zawarcie w klauzuli
User-Agent
pająka danych kontaktowych [Sposób 11.] Może to
być adres poczty elektronicznej lub adres strony. Trzeba pamiętać potem o sprawdzaniu
tego adresu i zapewnieniu, że znajdą się pod nim oczekiwane informacje

Czy w php jest możliwość zrobienia tego, że jak robot wejdzie np na forum to zamiast gość wyświetli nazwe robota którą mu nadam? Jeżeli tak to w jaki sposób?

Ten post edytował ExPlOiT 15.11.2007, 09:03:13
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
morrison
post
Post #2





Grupa: Zarejestrowani
Postów: 117
Pomógł: 0
Dołączył: 24.05.2004
Skąd: krakow

Ostrzeżenie: (10%)
X----


dolacze sie fo tematu.
najlepsza technologia do takich rzeczy to z pewnoscia J2EE.
pisze aplikacje ktora sama laczy sie z roznymi serwisami www ktore pozwalaja wyszukiwac numer telefonu na podstawie danych osobowych - nastepnie odbiera wyniki i wyswietla je. wyszukiwanie z serwisu PLUS i Dialog juz mi dziala, ale mam problem z tym:
http://www.sferia.pl/index.php?action=page...130&pid=169
czy zechce ktos zerknac na ten formularz i powiedziec mi na co powinienem zwrocic uwage? czy powinienem wysylac rowniez pole takie:
<input type="hidden" name="tc" value="" />
jesli nie ma zadnej wartosci? jesli tak to jak? druga rzecz to nazwy pol ktore wygladaja tak:
name="dane[nazwa_firmy]"
czy wysylajac w taki sposob: dane[nazwa_firmy]=costam ma prawo to dzialac? bo w input jest jeszcze ustawione to:
tabindex="3", nie bardzo wiem jak to dokladnie dziala.

generalnie pisze to w java z wyk. biblioteki java.net.HttpUrlConnection, ale mechanizm ten dziala chyba na podobnie jak Curl w php.
czyli w jednym miejscu podaje adres skryptu/serwletu do ktorego wysylam zadanie, a w dodatkowej zmiennej skladam ja z lancucha zawierajacego ciag zmiennych i ich wartosci, tak jak wyglada to w url'u.
i jeszcze to:
<form action="index.php?action=page&cid=130&pid=169&url=aHR0cDovL3d3dy5zZmVyaWEucGwvaW5kZXgucGhwP2FjdGlvbj1wYWdlJmNpZD0xMzAmcGlk
TE2OQ==" method="post">
moze mnie ktos upewnic czym tutaj jest zmienna 'url' i dlaczego ma taka wartosc? czyzby identyfikator sesji? jak moge to obejsc?

bede wdzieczny za pomoc w dostaniu sie do ich skryptu..

Ten post edytował morrison 16.11.2007, 09:48:18
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 24.12.2025 - 10:01