![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 87 Pomógł: 0 Dołączył: 27.02.2009 Ostrzeżenie: (0%) ![]() ![]() |
Mam następujący problem:
Jest sobie strona example.com, chcę przeparsować jej podstronę w o adresie URL powiedzmy example.com/foo.html. Oto wyrywek kodu HTML strony foo.html. Właśnie do kodu tego elementu chciałbym się "dobrać". Oczywiście w czystym kodzie HTML nie zawiera on żadnej zawartości. I teraz pytanie - jak wykonać żądanie parsujące (np. za pomocą cURL), aby dobrać się do zawartości tego div-a? Bardzo proszę odpowiedzi oraz z góry serdecznie dziękuję. |
|
|
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 62 Pomógł: 3 Dołączył: 12.04.2007 Skąd: Wągrowiec Ostrzeżenie: (0%) ![]() ![]() |
Pobierz zawartość strony do zmiennej i użyj wyrażeń regularnych.
|
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 87 Pomógł: 0 Dołączył: 27.02.2009 Ostrzeżenie: (0%) ![]() ![]() |
Ale przcież zawartość tego diva jest uzupełniona za pomocą JavaScript (np innerHTML).
|
|
|
![]()
Post
#4
|
|
Grupa: Zarejestrowani Postów: 45 Pomógł: 7 Dołączył: 29.04.2009 Skąd: Kraków Ostrzeżenie: (0%) ![]() ![]() |
Tego nie zrobisz cURLem.
Potrzebujesz obsługę JSa, która jak bóg przykazał zmieni tą wartość w divie. Do tego są już potrzebne programy według mnie. Choć możnaby się pobawić. Trzebaby napisać skrypt który "rozumie" strone i zapisze u Ciebie także plik JS który zmienia wartość Diva, a następnie uruchomić wygenerowane dane wraz z plikiem JS 'u siebie'. Choć nie polecam ze względów bezpieczeństwa. |
|
|
![]()
Post
#5
|
|
Grupa: Zarejestrowani Postów: 640 Pomógł: 44 Dołączył: 8.02.2004 Ostrzeżenie: (0%) ![]() ![]() |
Najprościej napisać gui-bota w Pythonie z wykorzystaniem Webkita z "frameworka" PyQt4 (IMG:http://forum.php.pl/style_emoticons/default/smile.gif) Wtedy masz dostęp do zrenderowanej zawartości strony, jak i też możesz na nią wpływać poprzez wykonywanie na niej własnego JavaScriptu.
|
|
|
![]() ![]() |
![]() |
Aktualny czas: 15.09.2025 - 02:04 |