Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [inne][HTML][PHP]parsowanie strony
bluebird
post
Post #1





Grupa: Zarejestrowani
Postów: 46
Pomógł: 0
Dołączył: 9.09.2009

Ostrzeżenie: (0%)
-----


witam próbuje sparsować stronę z listą hoteli (nazwa i adres) np.

CODE
$zm = file_get_contents("http://www.hotele.gpv.pl/augustow.php");
$regExp="|(.+)<div class=\"Section1\">(.+)<p class=\"MsoNormal\"><b>(.+)<\/b><\/p><p class=\"MsoNormal\">(.+)<\/p>(.+)<\/div>(.+)|";
preg_match_all($regExp, $zm, $info, PREG_SET_ORDER);


i nie działa (IMG:style_emoticons/default/aaevil.gif) , wyrażenia regularne są moją słabą stroną więc tam jest problem - czy mógłby ktoś zerknąć w kod... (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post
neverever
post
Post #2





Grupa: Zarejestrowani
Postów: 278
Pomógł: 44
Dołączył: 17.02.2004
Skąd: Wieliczka

Ostrzeżenie: (10%)
X----


wszystkie wpisy pobierzesz tak
  1. $regExp='/<p.class=MsoNormal>(.+?)<\/p>/';
  2. preg_match_all($regExp, $zm, $info);


wynikowa tablica będzie taka Array
(
[0] => Array
(
[0] => <p class=MsoNormal><b>Hotel „Warszawa”</b></p>
[1] => <p class=MsoNormal>ul. Zdrojowa 1</p>
[2] => <p class=MsoNormal>te. (0-87) 643 28 05, </p>
[3] => <p class=MsoNormal>607 294 243</p>
[4] => <p class=MsoNormal><a href="http://www.hotelwarszawa.pl/">www.hotelwarszawa.pl</a></p>
[5] => <p class=MsoNormal>&nbsp;</p>
[6] => <p class=MsoNormal><b>Hotel &quot;SPA Wojciech&quot;</b></p>
[7] => <p class=MsoNormal>Wojciech 15,</p>
[8] => <p class=MsoNormal>tel. (0-87) 644 72 37, (0-87) 644 72 38; </p>
[9] => <p class=MsoNormal><a href="http://www.augustow-wojciech.pl/">www.augustow-wojciech.pl</a></p>
[10] => <p class=MsoNormal><a href="http://www.hotelwojciech.pl/">www.hotelwojciech.pl</a></p>
[11] => <p class=MsoNormal>&nbsp;</p>
[12] => <p class=MsoNormal><b>Hotel „Leœnik”</b></p>
[13] => <p class=MsoNormal>ul. Turystyczna 19a</p>
[14] => <p class=MsoNormal>tel (0-87) 644 35 70; </p>
[15] => <p class=MsoNormal>tel/fax.(0-87) 644 36 70</p>
[16] => <p class=MsoNormal><a href="http://www.lesnik.pl/">www.lesnik.pl</a></p>
[17] => <p class=MsoNormal>&nbsp;</p>
)

[1] => Array
(
[0] => <b>Hotel „Warszawa”</b>
[1] => ul. Zdrojowa 1
[2] => te. (0-87) 643 28 05,
[3] => 607 294 243
[4] => <a href="http://www.hotelwarszawa.pl/">www.hotelwarszawa.pl</a>
[5] => &nbsp;
[6] => <b>Hotel &quot;SPA Wojciech&quot;</b>
[7] => Wojciech 15,
[8] => tel. (0-87) 644 72 37, (0-87) 644 72 38;
[9] => <a href="http://www.augustow-wojciech.pl/">www.augustow-wojciech.pl</a>
[10] => <a href="http://www.hotelwojciech.pl/">www.hotelwojciech.pl</a>
[11] => &nbsp;
[12] => <b>Hotel „Leœnik”</b>
[13] => ul. Turystyczna 19a
[14] => tel (0-87) 644 35 70;
[15] => tel/fax.(0-87) 644 36 70
[16] => <a href="http://www.lesnik.pl/">www.lesnik.pl</a>
[17] => &nbsp;
)

)


wiadomo, element $info[0][] = '<p class=MsoNormal>&nbsp;</p>'
lub $info[1][] = '&nbsp'

-oznacza koniec danych hotelu
Go to the top of the page
+Quote Post
bluebird
post
Post #3





Grupa: Zarejestrowani
Postów: 46
Pomógł: 0
Dołączył: 9.09.2009

Ostrzeżenie: (0%)
-----


wielkie dzieki (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 23.08.2025 - 20:22