... do wydobycia danych z plików html (może być to równie dobrze rogram w bashu, perlu, pythonie) który z plików o podanej strukturze:
<div class="col-lg-12 firma-name"> <h2 style="text-transform: uppercase">Centrum Okienne kowalski
</h2> <div class="col-lg-12 firma-medals"> <img src="/assets/img/medals/cache/medal_pl_2017.png"> <div class="col-xs-12 firma-desc"> <p>Firma kowalski ma za sobą 20 lat doświadczenia i tysiące zadowolonych klientów. Współprac
^M
Dla wielu rodzin zakup okien jest inwestycją na całe życie. Dokładamy więc wszelkich starań, aby była to inwestycja trafiona, a wybrane rozwiąz
<div class="col-xs-8 col-xs-offset-2 col-sm-12 col-sm-offset-0 firma-infos"> <p><b>Kod pocztowy
</b>: 00-210
</p> <p><b>Miejscowość
</b>:
<a class="city-link" href="/firmy,50718,Warszawa">Warszawa
</a> <p><b>Ulica
</b>: Przemysłowa 1
</p> <p><b>NIP
</b>: 8980010505
</p> : kontakt@kowalski-okna.pl
</p> <p><b>Strona WWW
</b>:
<a target="_blank"
href="http://www.kowalski-okna.pl">www.kowalski-okna.pl
</a> </p> <p><b>Telefon
</b>:
<span class="showPhone" data-id="56169">Pokaż
</span> <a data-lightbox="slideshow" href="assets/upload/photos/c54751ded94dd3a2896c2b39f43 <img src="/media/cache/card_thumb/assets/upload/photos/c54751ded94dd3a2896
Chcę aby program wydobył mi takie dane jak nazwa firy, adres, NIP, strona www itp a mówiąc łopatologicznie, potrzebuję to, co znajduje się w kontenerze "firma-desc" w pierwszym paragrafie (pomiędzy <p> a </p>) oraz "firma-desc" i "firma-infos". Są na to gotowce czy trzeba ręcznie klepać wyrażenia regularne?