![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 38 Pomógł: 0 Dołączył: 22.12.2008 Ostrzeżenie: (0%) ![]() ![]() |
Witam. Posiadam plik html, który po eliminacji niepotrzebnych znaczników, składa sie głownie z <div> i <span>. Div'y i span'y mają jakieś atrybuty bądź nie. Wygląda to mniej więcej tak:
Jest to pewien katalog kategorii. W <div> jest kategoria głowna, a w <div class="mg1"> jest kategoria podrzędna. Reszta div'ów mnie nie interesuje. Muszę powyciągać tylko te dwa div'y a dokładnie <span> z tych divów. Co najgorsze chyba, to fakt taki że ten plik html zajmuje jakies 4mln znaków. Próbowałem podejść do tego wyrażenie regularnym: ale wtedy pobiera wszystkie div'y. Udało mi się to w miarę osiągnąc poprzez XML:
Funkcja ta działa dla małego pliku index.html, niestety nie działa przy większym. Dostaję błąd: error: Excessive depth in document: 256 use XML_PARSE_HUGE option Co radzicie ![]() |
|
|
![]() ![]() |
![]() |
Aktualny czas: 20.08.2025 - 14:45 |