
napisałem skrypt który szuka linków na stronie, ale problem polega na tym że znajduje mi nawet adresy na które nieda się wejść czyl:
/intl/pl/ads/ /intl/pl/about.html
Jak zrobić aby szukał mi tylko adresy zaczynające się og http://www. Aktualnie mam taką regułke:
Cytat
<a(?:.*?)?href=\"(.*?)\"(?:.*?)?>)si
Wszystko ładnie pięknie znajduje, ale chcę odrzucić adresy tego typu oraz adresy do innych stron, tylko niewiem jak. Chodzi mi o to aby wyszukał tylko podstrony wgłąd jednego serwisu, bez znajdywania linków do innych.