Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> regexp, ignorowanie końcówki (formatu)
mrWodoo
post 11.06.2012, 18:00:20
Post #1





Grupa: Zarejestrowani
Postów: 160
Pomógł: 6
Dołączył: 13.01.2012
Skąd: Bytom

Ostrzeżenie: (0%)
-----


witam, chcę pobrać wszystkie linki, oprócz tych, które są w DOMENIE (zabroniona domena) i oprócz tych, które kończą się na .jpg
sprobowalem tak
  1. preg_match_all( '/(http|https|ftp)\&\#58\;\/\/(?!iv)([a-z0-9\-\.]{2,16})\.([a-z]{2,3})\/(.*)/i', $codeGlue, $otherLinks );


ale nie wiem co dalej... to nic nie dalo
  1. preg_match_all( '/(http|https|ftp)\&\#58\;\/\/(?!iv)([a-z0-9\-\.]{2,16})\.([a-z]{2,3})\/(.*)(?!jpg)/i', $codeGlue, $otherLinks );


bo pobiera ten link, tyle, ze bez koncowki jpg, a ja chce aby calkowicie to zignorowalo


--------------------
Go to the top of the page
+Quote Post
Crozin
post 11.06.2012, 18:03:37
Post #2





Grupa: Zarejestrowani
Postów: 6 476
Pomógł: 1306
Dołączył: 6.08.2006
Skąd: Kraków

Ostrzeżenie: (0%)
-----


1. Sobie znanymi sposobami pobierasz wszystkie URL-e do jakiejś tam tablicy.
2. Lecąc po każdym z nich rozbijasz go na poszczególne fragmenty przy pomocy parse_url.
3. Sprawdzenie hosta to zwykłe porównanie, a do wyciągnięcia rozszerzenia ze ścieżki URL-a masz pathinfo.
Go to the top of the page
+Quote Post
mrWodoo
post 11.06.2012, 18:05:45
Post #3





Grupa: Zarejestrowani
Postów: 160
Pomógł: 6
Dołączył: 13.01.2012
Skąd: Bytom

Ostrzeżenie: (0%)
-----


regexpem się nie da?


--------------------
Go to the top of the page
+Quote Post
Xorlgen
post 11.06.2012, 22:29:43
Post #4





Grupa: Zarejestrowani
Postów: 2
Pomógł: 0
Dołączył: 3.05.2012

Ostrzeżenie: (0%)
-----


Bez rozbicia nie wiem czy znajdziesz formułę. Lepiej to rozbij jak kolega napisał, bo inaczej po prostu utrudniasz sobie robotę : ).
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 19.07.2025 - 16:42