Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Szukam biblioteki
mvrht
post 23.07.2017, 16:43:08
Post #1





Grupa: Zarejestrowani
Postów: 1
Pomógł: 0
Dołączył: 23.07.2017

Ostrzeżenie: (0%)
-----


... do wydobycia danych z plików html (może być to równie dobrze rogram w bashu, perlu, pythonie) który z plików o podanej strukturze:
  1. <div class="col-lg-12 firma-name">
  2. <h2 style="text-transform: uppercase">Centrum Okienne kowalski</h2>
  3. </div>
  4. </div>
  5. <div class="row">
  6. <div class="col-lg-12 firma-medals">
  7. <img src="/assets/img/medals/cache/medal_pl_2017.png">
  8. </div>
  9. </div>
  10. <div class="row">
  11. <div class="col-xs-12 firma-desc">
  12. <h2>Opis firmy</h2>
  13. <p>Firma kowalski ma za sobą 20 lat doświadczenia i tysiące zadowolonych klientów. Współprac
  14. ^M
  15. Dla wielu rodzin zakup okien jest inwestycją na całe życie. Dokładamy więc wszelkich starań, aby była to inwestycja trafiona, a wybrane rozwiąz
  16. </div>
  17. </div>
  18. <div class="row">
  19. <div class="col-xs-8 col-xs-offset-2 col-sm-12 col-sm-offset-0 firma-infos">
  20. <p><b>Kod pocztowy</b>: 00-210</p>
  21. <p><b>Miejscowość</b>: <a class="city-link"
  22. href="/firmy,50718,Warszawa">Warszawa</a>
  23. </p>
  24. <p><b>Ulica</b>: Przemysłowa 1</p>
  25. <p><b>NIP</b>: 8980010505</p>
  26. <p><b>Email</b>
  27. : kontakt@kowalski-okna.pl</p> <p><b>Strona WWW</b>: <a
  28. target="_blank"
  29. href="http://www.kowalski-okna.pl">www.kowalski-okna.pl</a>
  30. </p> <p><b>Telefon</b>: <span class="showPhone"
  31. data-id="56169">Pokaż</span>
  32. </p>
  33. </div>
  34. </div>
  35. <div class="row">
  36. <div class="col-xs-12">
  37. <h3>Zdjęcia</h3>
  38. <a data-lightbox="slideshow" href="assets/upload/photos/c54751ded94dd3a2896c2b39f43
  39. <img src="/media/cache/card_thumb/assets/upload/photos/c54751ded94dd3a2896
  40. </a>

Chcę aby program wydobył mi takie dane jak nazwa firy, adres, NIP, strona www itp a mówiąc łopatologicznie, potrzebuję to, co znajduje się w kontenerze "firma-desc" w pierwszym paragrafie (pomiędzy <p> a </p>) oraz "firma-desc" i "firma-infos". Są na to gotowce czy trzeba ręcznie klepać wyrażenia regularne?
Go to the top of the page
+Quote Post
markuz
post 23.07.2017, 17:20:03
Post #2





Grupa: Zarejestrowani
Postów: 1 240
Pomógł: 278
Dołączył: 11.03.2008

Ostrzeżenie: (0%)
-----


https://github.com/tburry/pquery
http://simplehtmldom.sourceforge.net/


--------------------
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 25.04.2024 - 00:34