![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 4 Pomógł: 0 Dołączył: 21.06.2013 Ostrzeżenie: (0%) ![]() ![]() |
Witam,
właśnie piszę program służący do testowania serwera, takiego jakby crawlera, który przejdzie po wszystkich podstronach. Kolega doradził mi abym zrobił to na bazie danych. Miało by to wyglądzać następująco: - bot sczytuje wszystkie linki z podanej strony i zapisuje je do bazy, - wchodzi na pierwszą pierewszą podstronę, znowu sczytuje linki do bazy i tak aż dojdzie do końca ścieżki, - kiedy dojdzie do końca cofa się o jeden link do tyłu i przechodzi do kolejnych podstron no i tak aż przejdzie po wszystki podsztronach, - w bazie znajduje się kolumna checked, w której zaznaczanie jest czy dana podstrona została odwiedzona Niestety nie bardzo wiem jak się to tego zabrać jak narazie udało mi się zczytać wszystkie linki z danej strony i zapisać je do bazy ale nie wiem jak zrobić żeby przeszedł mi na pierwszą podstronę i z tamtąd sczytał linki i przeszedł dalej. Z góry dziękuję za pomoc |
|
|
![]()
Post
#2
|
|
![]() Grupa: Zarejestrowani Postów: 1 333 Pomógł: 137 Dołączył: 25.03.2008 Skąd: jesteś?? Ostrzeżenie: (0%) ![]() ![]() |
Curl + preg_match_all
-------------------- Mój blog - o wszystkim i niczym ale zazwyczaj związane z informatyką! ;-)
Githube Usługi spawalnicze i monterskie | Park linowy Lublin i Okunince |
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 4 Pomógł: 0 Dołączył: 21.06.2013 Ostrzeżenie: (0%) ![]() ![]() |
a nie możesz być zamiast curl file_get_content? słyszałem że z curl czasami jakieś problemy się pojawiają
|
|
|
![]()
Post
#4
|
|
![]() Grupa: Moderatorzy Postów: 36 557 Pomógł: 6315 Dołączył: 27.12.2004 ![]() |
Raczej na odwrot - to z file_get_contents moga byc problemy w zaleznosci od ustawien serwera
-------------------- "Myśl, myśl, myśl..." - Kubuś Puchatek || "Manual, manual, manual..." - Kubuś Programista "Szukaj, szukaj, szukaj..." - Kubuś Odkrywca || "Debuguj, debuguj, debuguj..." - Kubuś Developer |
|
|
![]()
Post
#5
|
|
Grupa: Zarejestrowani Postów: 4 Pomógł: 0 Dołączył: 21.06.2013 Ostrzeżenie: (0%) ![]() ![]() |
możliwe tamtą informację przeczytałem na jakimś forum także nie koniecznie musi być prawdziwa
|
|
|
![]()
Post
#6
|
|
![]() Grupa: Zarejestrowani Postów: 1 333 Pomógł: 137 Dołączył: 25.03.2008 Skąd: jesteś?? Ostrzeżenie: (0%) ![]() ![]() |
Używaj curl'a nawet jeśli było by Ci łatwiej użyć file_get_content to w przyszłości możesz zechcieć się logować czy zmieniać nagłówki lub nawet używać cookie i wtedy będziesz mieć już podstawy do tego. ;-)
-------------------- Mój blog - o wszystkim i niczym ale zazwyczaj związane z informatyką! ;-)
Githube Usługi spawalnicze i monterskie | Park linowy Lublin i Okunince |
|
|
![]() ![]() |
![]() |
Aktualny czas: 19.08.2025 - 06:32 |