Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Parser (nie do końca poprawnego) HTML, A dokładnie wyciąganie informacji z niego
suda
post 8.01.2007, 13:21:29
Post #1





Grupa: Zarejestrowani
Postów: 18
Pomógł: 0
Dołączył: 8.01.2007
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Mam plik HTML pobrany z zewnętrznego serwera i chcę z niego wyciągnąć niektóre informacje (dokładnie to chodzi o podstrony z Moje Allegro) tylko nie mogę znaleźć jakiegoś parsera do HTML który byłby odporny na nie poprawny kod a szukanie poprzez preg_match też ciężko tu zastosować bo w kodzie jest duży bałagan.

Przykładowy wiersz z danymi:
  1. <tr>
  2. <td class="list-color" align=center valign=top>
  3. <input type="checkbox" name="auctions_array[XXXXXXXXX]" value="XXXXXXXXX">
  4. <td class="list-color" style="text-align: left">
  5. <a href="/itemXXXXXXXXX.html">Nazwa</a>
  6. <a href="java script:open_note_edit('XXXXXXX', 'XXXXXXXXX', '1');" class="tip">
  7. <div class="tip">Tutaj możesz dodać notatkę o tym przedmiocie</div>
  8. <img src="/site_images/1/0/notes-inactive.gif" class="note-img" alt="" title="" border="0">
  9. </a><br />
  10. <span class=small>(XXXXXXXXX)</span>
  11. <td class="list-color">1<td class="list-color">4 dni<br>
  12. <i>(pią 12 sty 2007 19:45:29 CET)</i>
  13. <td class="list-color">12
  14. <td class="list-color">0
  15. <td class="list-color"><span class="small">-</span>
  16. <td class="list-color"><span class="small">200,00 zł</span>
  17. <td class="list-color">-
  18. <td class="list-color">-
  19. <td class="list-color">
  20. <a href="/item_change.php?item_id=XXXXXXXXX">Zmiany</a><br>
  21. <a href="/change_payu_option_do.php?item_id=XXXXXXXXX&action=add&type=sell">Dodaj Płatności Allegro</a><br>
  22. <span style="white-space: nowrap;"><a href="/new_item.php?next_item_id=XXXXXXXXX">Wystaw podobną</a>
  23. </TR>

Ma ktoś pomysł jak wyciągnąć te dane?
Go to the top of the page
+Quote Post
Cysiaczek
post 8.01.2007, 13:29:32
Post #2





Grupa: Moderatorzy
Postów: 4 465
Pomógł: 137
Dołączył: 26.03.2004
Skąd: Gorzów Wlkp.




Jak nie chcesz pregmatcha, to może spróbuj interfejs DOM. - IMO jednak pregmatch będzie szybszy (zależy ile danych chcesz wyciągnąć).

Pozdrawiam.


--------------------
To think for yourself you must question authority and
learn how to put yourself in a state of vulnerable, open-mindedness;
chaotic, confused, vulnerability, to inform yourself.
Think for yourself. Question authority.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 19.07.2025 - 23:51