Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [PHP][XML] Parsowanie niedoskonałego dokumentu
wNogachSpisz
post
Post #1





Grupa: Zarejestrowani
Postów: 1 233
Pomógł: 87
Dołączył: 6.03.2009

Ostrzeżenie: (40%)
XX---


Witam, mam taki oto kod HTML:

  1. <p>
  2. <div><input type="text"></div>
  3. </p>
  4. <p>
  5. <div></div>
  6. </p>
  7. </body>
  8. </html>


Szukam sposobu aby swobodnie przezeń traversować. Niestety, kod nie jest prawidłowym XMLelem ani HTMLem. Po pierwsze w paragrafach nie mogą znajdować się elementy blokowe i dom:document podczas ładowania dokumentu wyrzuca DIV'y na koniec BODY, w efekcie obiekt DOM jest inny niż mogłoby wynikać z kodu HTML i staje się praktycznie bezużyteczny. Natomiast SimpleXML informuje że element input jest nieprawidłowo zakończony, oczywiście ma racje.

Jak zatem ugryść taki dokument?

Z góry dzięki za pomoc.

Ten post edytował wNogachSpisz 12.02.2012, 12:40:57
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
wNogachSpisz
post
Post #2





Grupa: Zarejestrowani
Postów: 1 233
Pomógł: 87
Dołączył: 6.03.2009

Ostrzeżenie: (40%)
XX---


Cytat(szagi3891 @ 13.02.2012, 00:32:47 ) *
Spróbuj tego : http://php.net/manual/en/domdocument.loadhtml.php

Ta funkcja wczytuje kod html do obiektu DOMDocument.

Rozumiem że czytanie pytań boli, ale może zrobisz wyjątek i zadasz sobie ten trud. Tylko ten jeden raz, proszę, zrób to dla mnie.

Stwierdziłem że najlepiej pogodzić się ze zmianami jakie wprowadza DOM:Document. Czyli robie tak ze ładuje nieprawidłowy HTML przez loadHTML, potem zapisuje przez saveHTML i trawersuje po takim jaki został zwrócony. Nie wiem dlaczego od razu na to nie wpadłem (IMG:style_emoticons/default/tongue.gif)

Ten post edytował wNogachSpisz 13.02.2012, 01:20:26
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 18.09.2025 - 12:29