![]() |
![]() |
![]()
Post
#1
|
|
![]() Grupa: Zarejestrowani Postów: 999 Pomógł: 30 Dołączył: 14.01.2007 Skąd: wiesz ? Ostrzeżenie: (0%) ![]() ![]() |
Cześć,
Mam kod HTML w którym muszę wykryć tag nie mający zamknięcia na jednej linii domknąć go i skopiować jego część otwierającą na następną linie. np. Cytat mój <span class="pink">różowy pies ma<span> 5 <span class="blue">niebieskich</span> łat <span class="grey">szary</span> ogon, a jego <span class="brown>brązowe oczy, również są</span> <span class="green">zielone</span> Do postaci: mój <span class="pink">różowy pies</span> <span class="pink">ma<span> 5 <span class="blue">niebieskich</span> łat <span class="grey">szary</span> ogon, a jego <span class="brown>brązowe oczy,</span> <span class="brown>również są</span> <span class="green">zielone</span> Muszę w tym celu wykryć dodatkowe tagi otwierające, które nie mają na danej linii pary. Idzie mi jak po grudzie. Kod poniżej to udowadnia. Jak wyłuskać te niedomknięte tagi na danej linii przy użyciu wyrażeń regularnych?
|
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 6 380 Pomógł: 1116 Dołączył: 30.08.2006 Ostrzeżenie: (0%) ![]() ![]() |
A co chcesz uzyskać? Ja bym to przepuścił przez http://php.net/manual/en/book.tidy.php
-------------------- |
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 324 Pomógł: 105 Dołączył: 7.08.2012 Ostrzeżenie: (0%) ![]() ![]() |
Może HTML Purifier?
Ogólnie regex i html to stąpanie po cieńkim lodzie ![]() Ten post edytował kreatiff 23.10.2014, 18:43:06 |
|
|
![]()
Post
#4
|
|
![]() Grupa: Zarejestrowani Postów: 999 Pomógł: 30 Dołączył: 14.01.2007 Skąd: wiesz ? Ostrzeżenie: (0%) ![]() ![]() |
Niestety ani purifier ani tidy nie robią tego na czym mi zależy.
Przykłady: Działa:
Nie działa:
Zmniejszenie zachłanności przez dodanie ? po * też nie przynosi oczekiwanych rezultatów. Potrzebny mi ostatni tag <span> który nie ma zamknięcia. Ten post edytował starach 24.10.2014, 06:15:13 |
|
|
![]()
Post
#5
|
|
Grupa: Zarejestrowani Postów: 324 Pomógł: 105 Dołączył: 7.08.2012 Ostrzeżenie: (0%) ![]() ![]() |
|
|
|
![]()
Post
#6
|
|
![]() Grupa: Zarejestrowani Postów: 999 Pomógł: 30 Dołączył: 14.01.2007 Skąd: wiesz ? Ostrzeżenie: (0%) ![]() ![]() |
kurcze dzięki, działa... tylko dlaczego to działa? :|
|
|
|
![]()
Post
#7
|
|
Grupa: Zarejestrowani Postów: 324 Pomógł: 105 Dołączył: 7.08.2012 Ostrzeżenie: (0%) ![]() ![]() |
Postaram się tak na chłopski rozum opisać, ale nie obiecuję, że się rozjaśni
![]() Kluczowe są tutaj: $ - koniec linii/stringa (?!</span>). - dowolny znak (kropka), który nie jest poprzedzony </span>, dalsza * oznacza 0 lub więcej takich znaków ?: to po prostu pominięcie łapania danej grupy (wynik łapania z tego nawiasu nie trafia do $aMatch) Nasze wyrażenie szuka w ciągu takiego </span>, po którym już to </span> więcej nie wystąpi. I wówczas wszystko po tym zamykającym tagu jest łapane. Jeśli po pierwszym </span> silnik regex znajdzie kolejne </span>, to omija to co napotkał do tej pory i zaczyna dopasowywanie od tego kolejnego domknięcia tagu span. Itd. aż nie trafi na domknięcie do samego końca ciągu, co w konsekwencji oznacza, że wszystko co złapał jest tym co nas interesuje. Ten post edytował kreatiff 24.10.2014, 13:18:34 |
|
|
![]()
Post
#8
|
|
![]() Grupa: Zarejestrowani Postów: 999 Pomógł: 30 Dołączył: 14.01.2007 Skąd: wiesz ? Ostrzeżenie: (0%) ![]() ![]() |
No tak kropka pobiera dowolny znak natomiast negative lookahead wymusza żeby znaleziony znak nie był częścią taga zamykającego. Natomiast * oczywiście powtarza znaleziony i przefiltrowany już znak. Tak proste że aż mi głupio że na to nie wpadłem. Dzięki wielkie. ![]() Ten post edytował starach 24.10.2014, 13:35:41 |
|
|
![]() ![]() |
![]() |
Wersja Lo-Fi | Aktualny czas: 14.08.2025 - 06:25 |