Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Problem z odczytaniem pliku HTML.
kaapa
post
Post #1





Grupa: Zarejestrowani
Postów: 9
Pomógł: 0
Dołączył: 13.04.2007

Ostrzeżenie: (0%)
-----


Witam!
Potrzebuję odczytać plik html podobnie jak xml(najlepiej przez simplexml, chociaż domem też nie pogardzę). Chodzi o to że strona nie ma odpowiedniej struktury i dlatego plik nie może zostać załadowany ani przez dom ani przez simplexml. Wyrzuca mniej więcej takie błędy
  1. <?php
  2. Warning: simplexml_load_file() [function.simplexml-load-file]: test.html:34: parser error : Opening and ending tag mismatch: link line 14 and head in D:xampphtdocssygnaturka&#092;test.php on line 2
  3.  
  4. Warning: simplexml_load_file() [function.simplexml-load-file]: </head> in D:xampphtdocssygnaturka&#092;test.php on line 2
  5. ?>


Oczywiście dane mogę odczytać przez explode, ale to strasznie ograniczy wydajność skryptu. Czy można jakoś ominąć dokładne sprawdzanie struktury dokumentu?
Proszę o pomoc.
Pozdrawiam,
Kacper.
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
l0ud
post
Post #2





Grupa: Zarejestrowani
Postów: 1 387
Pomógł: 273
Dołączył: 18.02.2008

Ostrzeżenie: (0%)
-----


Nie da się przetworzyć niepoprawnego kodu XML. Dlaczego przeglądarki nie potrafią wyświetlić strony w XHTML1.1 gdy ta zawiera nawet jeden, drobny błąd?

kaapa, pozostaje Ci użyć do tego wyrażeń regularnych. Wydajnością bym się nie martwił - i tak 99% czasu wykonywania skryptu zajmie ściąganie tego pliku...
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 25.12.2025 - 23:52