Forum PHP.pl

Forum PHP.pl > Forum > PHP

Reply to this topic

Start new topic

Regex - łapanie odpowiednich tagów zamykających

SN@JPER^ Zobacz profil	10.11.2017, 13:32:39 Post #1
Grupa: Zarejestrowani Postów: 266 Pomógł: 0 Dołączył: 4.01.2007 Skąd: Szczecin Ostrzeżenie: (0%)	Witam. Mam taki kod, którym próbuję wyciągnąć dane pomiędzy tym divem. Jednak w tym divie są inne divy i kończy "łapanie" na pierwszym napotkanym, zamykającym </div>. Jak mogę zrobić, aby rozpoznawało tag odpowiednio zamykający? [PHP] pobierz, plaintext preg_match_all("'<div id=\"left\" class=\"mb\">(.*?)</div>'is", $html, $matches); [PHP] pobierz, plaintext

Pyton_000 Zobacz profil	10.11.2017, 13:41:53 Post #2
Grupa: Zarejestrowani Postów: 8 068 Pomógł: 1414 Dołączył: 26.10.2005 Ostrzeżenie: (0%)	Łapy się obcina za parsowanie HTML przy pomocy RegEx... Do tego są odpowiednie narzędzia np: http://simplehtmldom.sourceforge.net/ https://github.com/sunra/php-simple-html-dom-parser i wieeele innnych.

SN@JPER^ Zobacz profil	10.11.2017, 14:04:24 Post #3
Grupa: Zarejestrowani Postów: 266 Pomógł: 0 Dołączył: 4.01.2007 Skąd: Szczecin Ostrzeżenie: (0%)	Dzięki za narzędzia! A tak dla samej wiedzy - jest jakaś magiczna sztuczka z regex, która to wyłapie?

Pyton_000 Zobacz profil	10.11.2017, 14:05:37 Post #4
Grupa: Zarejestrowani Postów: 8 068 Pomógł: 1414 Dołączył: 26.10.2005 Ostrzeżenie: (0%)	Przeczytaj jeszcze raz co napisałem Nie dociekaj a wyjdziesz na zdrowie

kreatiff Zobacz profil	10.11.2017, 15:36:07 Post #5
Grupa: Zarejestrowani Postów: 324 Pomógł: 105 Dołączył: 7.08.2012 Ostrzeżenie: (0%)	W (.?) masz łapanie leniwe (lazy, czyli łapanie najmniej jak się da), właśnie przez ten znak zapytania. Usuń go, a dopasowywanie zmieni się w zachłanne (greedy, dopasuj maksymalnie dużo). Możesz też użyć modyfikatora U, który zmienia (odwraca) zachłanność wzoru, bez usuwania tego znaku zapytania. W wyniku wyrażenia regularnego nadal będziesz musiał pozbyć się nadliczbowych znaczników <div>. Ten post edytował kreatiff* 10.11.2017, 15:43:58

trzczy Zobacz profil	10.11.2017, 16:31:14 Post #6
Grupa: Zarejestrowani Postów: 460 Pomógł: 49 Dołączył: 5.06.2011 Ostrzeżenie: (0%)	W ogóle tu pojawia się pytanie, co z takimi przypadkami: [SQL] pobierz, plaintext class = "mb" class ="mb" class= "mb" class=" mb" class = "foo mb" [SQL] pobierz, plaintext Klasa może być na wiele sposobów przypisana. Czy regex ma je wszystkie uwzględniać? Zatem w przypadku regex, trzeba wiedzieć, jaki to skomplikowany problem. Ten post edytował trzczy 10.11.2017, 16:34:44

kreatiff Zobacz profil	10.11.2017, 16:55:33 Post #7
Grupa: Zarejestrowani Postów: 324 Pomógł: 105 Dołączył: 7.08.2012 Ostrzeżenie: (0%)	Można pominąć całkiem, skoro nie jest to w ogóle potrzebne: '#<div.?>(.?)</div>#is'. ed. chyba. że chodzi ci o divy z tą konkretną klasą "mb", to wówczas można kombinować: '#<div.?class=".?mb.?".?>(.?)</div>#is' Ale to może się okazać ślepym zaułkiem. Ten post edytował kreatiff* 10.11.2017, 17:00:48

Pyton_000 Zobacz profil	10.11.2017, 17:01:14 Post #8
Grupa: Zarejestrowani Postów: 8 068 Pomógł: 1414 Dołączył: 26.10.2005 Ostrzeżenie: (0%)	ale Wy macie problem. RegExp NIE używa się do parsowania DOM - koniec kropka...

trueblue Zobacz profil	10.11.2017, 21:03:38 Post #9
Grupa: Zarejestrowani Postów: 6 806 Pomógł: 1828 Dołączył: 11.03.2014 Ostrzeżenie: (0%)	[PHP] pobierz, plaintext $html=' <div id="left" class=" mb klasa">1<p>abc</p></div> <div id="left2" class = "mb klasa">2<p>def</p></div> <div id="left3" class="mb1 klasa">3<p>ghi</p></div> <div id="left4" class="mbklasa">4<p>jkl</p></div>'; $dom = new DOMDocument; $dom->loadHTML($html); $dom->encoding = 'UTF-8'; $xpath = new DOMXPath($dom); $divs = $xpath->query('//div[contains(concat(" ",normalize-space(@class)," ")," mb ")]'); foreach($divs as $div){ echo $div->textContent; } [PHP] pobierz, plaintext http://kawalekkodu.pl/post/the-tag-is-out-...domxpath-s01e01 -------------------- https://kawalekkodu.pl

SN@JPER^ Zobacz profil	11.11.2017, 10:40:15 Post #10
Grupa: Zarejestrowani Postów: 266 Pomógł: 0 Dołączył: 4.01.2007 Skąd: Szczecin Ostrzeżenie: (0%)	To może lepsze pytanie - które narzędzie wybrać? DOMXPath, php-simple-html-dom-parser, phpquery lub inne? Które jest najaktualniejsze, ma wsparcie i najczęściej się używa?

trueblue Zobacz profil	11.11.2017, 10:51:49 Post #11
Grupa: Zarejestrowani Postów: 6 806 Pomógł: 1828 Dołączył: 11.03.2014 Ostrzeżenie: (0%)	Klasy DOMDocument i DOMXPath bazują na rozszerzeniu libxml, który jest częścią kompilacji PHP (najczęściej jest). Czyli są naturalną częścią PHP. XPath ma na pewno większe możliwości niż SimpleHTMLDom, co do PHPQuery, to wydaje mi się, że jeśli chodzi o selektory, to ciut większe. Zapis XPath może być trochę zniechęcający, ale możliwości spore. Ale to zależy od Ciebie. -------------------- https://kawalekkodu.pl

« Następny starszy · PHP · Następny nowszy »

Reply to this topic

Start new topic

1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Tryb wyświetlania: Standardowy · Przełącz na: Linearny+ · Przełącz na: Drzewo

Śledź ten temat · Wyślij temat na e-mail · Wydrukuj ten temat · Subskrybuj to forum

Aktualny czas: 21.08.2025 - 07:08

Powered By IP.Board © 2025 IPS, Inc.
All changes by PHP.pl Administrators

Hosting zapewnia

NQ.pl hosting, trac, svn