Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Crawler do testów, PHP i MySQL
tmk29121992
post
Post #1





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 21.06.2013

Ostrzeżenie: (0%)
-----


Witam,
właśnie piszę program służący do testowania serwera, takiego jakby crawlera, który przejdzie po wszystkich podstronach. Kolega doradził mi abym zrobił to na bazie danych. Miało by to wyglądzać następująco:
- bot sczytuje wszystkie linki z podanej strony i zapisuje je do bazy,
- wchodzi na pierwszą pierewszą podstronę, znowu sczytuje linki do bazy i tak aż dojdzie do końca ścieżki,
- kiedy dojdzie do końca cofa się o jeden link do tyłu i przechodzi do kolejnych podstron no i tak aż przejdzie po wszystki podsztronach,
- w bazie znajduje się kolumna checked, w której zaznaczanie jest czy dana podstrona została odwiedzona

Niestety nie bardzo wiem jak się to tego zabrać jak narazie udało mi się zczytać wszystkie linki z danej strony i zapisać je do bazy ale nie wiem jak zrobić żeby przeszedł mi na pierwszą podstronę i z tamtąd sczytał linki i przeszedł dalej. Z góry dziękuję za pomoc
Go to the top of the page
+Quote Post
ShadowD
post
Post #2





Grupa: Zarejestrowani
Postów: 1 333
Pomógł: 137
Dołączył: 25.03.2008
Skąd: jesteś??

Ostrzeżenie: (0%)
-----


Curl + preg_match_all


--------------------
Mój blog - o wszystkim i niczym ale zazwyczaj związane z informatyką! ;-)
Githube

Usługi spawalnicze i monterskie | Park linowy Lublin i Okunince
Go to the top of the page
+Quote Post
tmk29121992
post
Post #3





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 21.06.2013

Ostrzeżenie: (0%)
-----


a nie możesz być zamiast curl file_get_content? słyszałem że z curl czasami jakieś problemy się pojawiają
Go to the top of the page
+Quote Post
nospor
post
Post #4





Grupa: Moderatorzy
Postów: 36 557
Pomógł: 6315
Dołączył: 27.12.2004




Raczej na odwrot - to z file_get_contents moga byc problemy w zaleznosci od ustawien serwera


--------------------

"Myśl, myśl, myśl..." - Kubuś Puchatek || "Manual, manual, manual..." - Kubuś Programista
"Szukaj, szukaj, szukaj..." - Kubuś Odkrywca || "Debuguj, debuguj, debuguj..." - Kubuś Developer

Go to the top of the page
+Quote Post
tmk29121992
post
Post #5





Grupa: Zarejestrowani
Postów: 4
Pomógł: 0
Dołączył: 21.06.2013

Ostrzeżenie: (0%)
-----


możliwe tamtą informację przeczytałem na jakimś forum także nie koniecznie musi być prawdziwa
Go to the top of the page
+Quote Post
ShadowD
post
Post #6





Grupa: Zarejestrowani
Postów: 1 333
Pomógł: 137
Dołączył: 25.03.2008
Skąd: jesteś??

Ostrzeżenie: (0%)
-----


Używaj curl'a nawet jeśli było by Ci łatwiej użyć file_get_content to w przyszłości możesz zechcieć się logować czy zmieniać nagłówki lub nawet używać cookie i wtedy będziesz mieć już podstawy do tego. ;-)


--------------------
Mój blog - o wszystkim i niczym ale zazwyczaj związane z informatyką! ;-)
Githube

Usługi spawalnicze i monterskie | Park linowy Lublin i Okunince
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 19.08.2025 - 06:32