Post
#1
|
|
|
Grupa: Zarejestrowani Postów: 2 Pomógł: 0 Dołączył: 13.10.2012 Ostrzeżenie: (0%)
|
Witam,
Chciałbym (częściowo jestem do tego zmuszony) zrobić na użytek własny parser ogłoszeń (głównie motoryzacyjnych). Interesowałby mnie np. te trzy serwisy: - otomoto, np.: http://otomoto.pl/renault-clio-rs-C26108070.html - gumtree, np.: http://warszawa.gumtree.pl/c-Samochody-Mot...QAdIdZ419403932 - moto.gratka, np: http://moto.gratka.pl/tresc/peugeot-3008-h...i-13697691.html Miałoby to działać na zasadzie 'schowka'. Wklejam na swojej stronie link do ogłoszenia, serwer na podstawie linku wybiera odpowiedni skrypt, parsuje treść (model, rocznik, przebieg itd.), zapisuje dane do bazy i wyświetla na stronie w formie tabelki. Szukam jak najprostszego rozwiązania (znam HTML/CSS, podstawy PHP i MySQLa). Czytałem o HTML DOM Parser - czy za jego pomocą dałoby się 'ściągnąć dane' z ww. serwisów? Patrzę na kod źródłowy otomoto i teoretycznie można znaleźć jakąś regułę (parametr w znaczniku <dt></dt>, a jego wartość w <span></span>). Pytanie jak to wygląda w praktyce? Nie mam w tej dziedzinie żadnego doświadczenia, dlatego prosiłbym Was o pomoc. Nie chodzi mi tutaj o gotowca, tylko o zasugerowanie jakiegoś narzędzia, dzięki któremu uda mi się osiągnąć opisany cel (w możliwie najprostszy sposó(IMG:style_emoticons/default/cool.gif) . Pozdrawiam! |
|
|
|
![]() |
Post
#2
|
|
|
Grupa: Zarejestrowani Postów: 1 332 Pomógł: 294 Dołączył: 12.10.2008 Skąd: Olkusz Ostrzeżenie: (0%)
|
najmniej problemów będziesz miał z DOM (oczywiście będziesz musiał go zrozumieć)... jeśli chciałbyś łatwo parsować strony nawet z treścią JS to najwygodniej skorzystać z QT (C++) gdzie jest też przeglądarka WebKit i także możesz korzystać z metod DOM'u, w QT możesz także pisać sporą część aplikacji w JS...
Podsumowując w PHP skorzystaj z DOM, dodatkowo masz biblioteki typu phpQuery wzorujące się na jQuery gdzie możesz odpytywać za pomocą selektorów CSS oraz inne... dodatkowo nie pamiętam ale chyba w ZF2 coś podobnego jest umożliwiającego łatwe przeszukiwanie drzewa DOM za pomocą selektorów CSS Ten post edytował zegarek84 13.10.2012, 18:45:04 |
|
|
|
bigevil Parsowanie stron www - kilka pytań 13.10.2012, 12:22:43
cudny Kilka rzeczy:
Od strony PHP możesz wyciągnąć treś... 13.10.2012, 12:28:41
CuteOne Nie radze parsować strony za pomocą wyrażeń regula... 13.10.2012, 13:12:37
cudny CuteOne czemu nie radzisz używać wyrażeń reg. ?
Ja... 13.10.2012, 13:47:29
karakara (Subiektywnie) Najprościej będzie w Pythonie i Bea... 13.10.2012, 14:15:54
Crozin @cudny: Żeby się nie powtarzać: http://stackoverfl... 13.10.2012, 14:50:25
bigevil Dziękuję za odpowiedzi. Stronka miałaby być prywat... 13.10.2012, 17:56:24
cudny Cytat(Crozin @ 13.10.2012, 14:50:25 )... 13.10.2012, 20:19:33
erix Cytatjak można napisać w kilku dosłownie znakach z... 15.10.2012, 12:45:05 ![]() ![]() |
|
Aktualny czas: 7.12.2025 - 05:00 |