Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [PHP]Wyszukiwanie linków na stronie
adas007
post
Post #1





Grupa: Zarejestrowani
Postów: 72
Pomógł: 0
Dołączył: 9.03.2007

Ostrzeżenie: (0%)
-----


Witam.
Używając biblioteki cURL chcę napisać funkcję, która będzie wyszukiwała mi odnośniki w treści strony www. Pomyślałem żeby treść strony zapisać w stringu(do tego użyję funkcji biblioteci cURL) a potem w tym stringu wyszukiwać znaczniki <a href =.... > i zczytywać link , który znajduje się po znaku = . Tu moje pytanie jak wyszukać string wewnątrz innego stringu ? A może macie jakąś sugestię jak inaczej wykonać takie zczytywanie linków ze strony? W dokumentacji cURL nie widziałem funkcji do wykonania przeszukiwania treści strony.

Ten post edytował adas007 5.11.2008, 12:03:18
Go to the top of the page
+Quote Post
bregovic
post
Post #2





Grupa: Zarejestrowani
Postów: 562
Pomógł: 15
Dołączył: 8.08.2003
Skąd: Denmark/Odense

Ostrzeżenie: (0%)
-----


No, bez wujka regexa (wyrażenia regularne) to się chyba nie obejdzie - preg_match_all" title="Zobacz w manualu PHP" target="_manual.


--------------------
Prank - for the fun. Mac - for the simplicity. Deviantart - for the kick.
Life is ours, We live it our way -- Metallica
Go to the top of the page
+Quote Post
adas007
post
Post #3





Grupa: Zarejestrowani
Postów: 72
Pomógł: 0
Dołączył: 9.03.2007

Ostrzeżenie: (0%)
-----


Ehhh nie mogę sobie poradzić z napisaniem wyrażenia regularnego, które pasowałoby do adresu strony w znaczniku <a href="adres strony">.

Narazie mam coś takiego:

  1. <?php
  2. preg_match_all('/href.*=.*['"](.*)['"].*>(.*)</a>/isU',$strona,$linki);
  3. ?>

w zmiennej $strona mam zawarty kod strony www. Po operacji dopasowania do wyrażenia stringu:

<a href="http://www.chemia.uni.lodz.pl/" target="_top">Faculty of Chemistry</a>

W tablicy z wynikami : $link[2][2] mam Faculty of Chemistry a chiałbym mieć http://www.chemia.uni.lodz.pl/


Edit:

Problem rozwiązany wyświetlałem nie te elementy tablizy $linki co należało/// linki są w elemetach $linki[1][1], $linki[1][2] itd

Ten post edytował adas007 5.11.2008, 18:18:07
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 20.08.2025 - 14:22