![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 2 Pomógł: 0 Dołączył: 13.10.2012 Ostrzeżenie: (0%) ![]() ![]() |
Witam,
Chciałbym (częściowo jestem do tego zmuszony) zrobić na użytek własny parser ogłoszeń (głównie motoryzacyjnych). Interesowałby mnie np. te trzy serwisy: - otomoto, np.: http://otomoto.pl/renault-clio-rs-C26108070.html - gumtree, np.: http://warszawa.gumtree.pl/c-Samochody-Mot...QAdIdZ419403932 - moto.gratka, np: http://moto.gratka.pl/tresc/peugeot-3008-h...i-13697691.html Miałoby to działać na zasadzie 'schowka'. Wklejam na swojej stronie link do ogłoszenia, serwer na podstawie linku wybiera odpowiedni skrypt, parsuje treść (model, rocznik, przebieg itd.), zapisuje dane do bazy i wyświetla na stronie w formie tabelki. Szukam jak najprostszego rozwiązania (znam HTML/CSS, podstawy PHP i MySQLa). Czytałem o HTML DOM Parser - czy za jego pomocą dałoby się 'ściągnąć dane' z ww. serwisów? Patrzę na kod źródłowy otomoto i teoretycznie można znaleźć jakąś regułę (parametr w znaczniku <dt></dt>, a jego wartość w <span></span>). Pytanie jak to wygląda w praktyce? Nie mam w tej dziedzinie żadnego doświadczenia, dlatego prosiłbym Was o pomoc. Nie chodzi mi tutaj o gotowca, tylko o zasugerowanie jakiegoś narzędzia, dzięki któremu uda mi się osiągnąć opisany cel (w możliwie najprostszy sposó(IMG:style_emoticons/default/cool.gif) . Pozdrawiam! |
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 387 Pomógł: 66 Dołączył: 31.03.2005 Skąd: Kielce Ostrzeżenie: (0%) ![]() ![]() |
Kilka rzeczy:
Od strony PHP możesz wyciągnąć treść strony poprzez $content = file_get_content( 'url' ); Jeśli jedna potrzebujesz wysłać jakiś formularz to należy użyć cULR'a Parsujesz używając wyrażeń regularnych, żeby wyciągnąć coś z div'a o id="costam" to (pisze z palca wiec może nie zadziałać): /\<div\s.*id=\"costam\"[^\>]>(.*?)\<\/div\>/ A jeśli jednak chcesz na tym zarobić i to zrobić szybko to zleć to komuś. Wyrażenia regularne dla początkującego są na prawde trudne |
|
|
![]() ![]() |
![]() |
Aktualny czas: 18.10.2025 - 01:31 |