[HTML][PHP]Regexp - jak wyciaganc tylko tekst

[HTML][PHP]Regexp - jak wyciaganc tylko tekst

dolar Zobacz profil	24.05.2017, 10:06:19 Post #1
Grupa: Zarejestrowani Postów: 92 Pomógł: 0 Dołączył: 19.10.2016 Ostrzeżenie: (0%)	MAm taki oto zapis z html: [HTML] pobierz, plaintext <div class="latestItemIntroText"> <div class="itemLinks"> <div class="share">Share</div> <div class="dummy-div"></div> <div class="addthis_sharing_toolbox"></div> </div> (</p> ---> to moze byc lub nie) Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip (<br /><br />) -> tutaj tez czasem moze byc lub nie jakas br lub cokolwiek ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum </p><br/> --> to tez moze sie pojawic lub nie </div> [HTML] pobierz, plaintext Jak do tej pory mam taki zapis: <div class="addthis_sharing_toolbox"><\/div>([ \s?]+)<\/div>([^<]+)<\/div> To mi ladnie wyciaga tekst, ale bez <p>, bo jesli znajdzie sie tam pomiedzy <p> lub <br/> to juz jest problem i mi nie wyciaga textu. Jak mozna ulepszyc moj zapis regex? O ile da sie cos takiego w ogole wyciaganc...

Odpowiedzi

viking Zobacz profil	24.05.2017, 10:10:32 Post #2
Grupa: Zarejestrowani Postów: 6 381 Pomógł: 1116 Dołączył: 30.08.2006 Ostrzeżenie: (0%)	Wyrażenia regularne nie służą do obróbki DOM. Zainteresuj się funkcjami DOM typu simplexml.

bostaf Zobacz profil	24.05.2017, 11:05:59 Post #3
Grupa: Zarejestrowani Postów: 374 Pomógł: 79 Dołączył: 6.04.2010 Skąd: Ostrów Wielkopolski Ostrzeżenie: (0%)	Cytat(viking @ 24.05.2017, 11:10:32 ) Wyrażenia regularne nie służą do obróbki DOM. Zainteresuj się funkcjami DOM typu simplexml. Ja się po tym podpisuję, i zasugerowałbym też hasło "html/dom parser", ale dla zabawy zrobiłem tego regexa: Kod <div class="addthis_sharing_toolbox"><\/div>\s+<\/div>((^\|.\|\s)+)<\/div> sam tekst czyli to co w regexie w nawiasie wyciągniesz w php preg_match (parametr matches), a te zbędne tagi wewnątrz tekstu strip_tags. Samym regexem nie da się pominąć fragmentów tekstu.

Posty w temacie

dolar [HTML][PHP]Regexp - jak wyciaganc tylko tekst 24.05.2017, 10:06:19

viking Wyrażenia regularne nie służą do obróbki DOM. Zain... 24.05.2017, 10:10:32

bostaf Cytat(viking @ 24.05.2017, 11:10:32 )... 24.05.2017, 11:05:59

dolar Hmm nigdy o tym co mi napsiales jeszcze nie slysza... 24.05.2017, 10:13:37

dolar @bostav @vikinh - dzieki za podpowiedz. Wlasnie cz... 24.05.2017, 13:13:46

viking Wypadało by wcześniej dołączyć pliki biblioteki si... 24.05.2017, 13:17:41

dolar Cytat(viking @ 24.05.2017, 14:17:41 )... 24.05.2017, 13:19:38

Pyton_000 Kod<div class="addthis_sharing_toolbox... 24.05.2017, 13:41:47

dolar $html->find('.latestItemIntroText... 24.05.2017, 13:53:20

Pyton_000 var_dump($html->find('.latestItemIntro... 24.05.2017, 14:02:52

dolar No dobra, a czy jest mozliwosc tym DOM'em zrob... 24.05.2017, 14:07:46

viking simplehtml nie obsługuje selektora :not. Możesz us... 24.05.2017, 15:24:09

2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Tryb wyświetlania: Przełącz na: Standardowy · Przełącz na: Linearny+ · Drzewo

Aktualny czas: 3.10.2025 - 03:40

Hosting zapewnia

Forum PHP.pl