Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [inne]regexr.com wyciąganie samych linków
lekosm2
post 13.01.2018, 09:14:33
Post #1





Grupa: Zarejestrowani
Postów: 141
Pomógł: 0
Dołączył: 9.10.2015

Ostrzeżenie: (0%)
-----


Jakim wyrażeniem mogę na stronie https://regexr.com/ wyciągnąć tylko linki z tekstu?
Go to the top of the page
+Quote Post
trzczy
post 13.01.2018, 09:41:46
Post #2





Grupa: Zarejestrowani
Postów: 460
Pomógł: 49
Dołączył: 5.06.2011

Ostrzeżenie: (0%)
-----


[MYSQL] pobierz, plaintext
  1. _^(?:(?:https?|ftp)://)(?:\S+(?::\S*)?@)?(?:(?!10(?:\.\d{1,3}){3})(?!127(?:\.\d{1,3}){3})(?!169\.254(?:\.\d{1,3}){2})(?!192\.168(?:\.\d{1,3}){2})(?!172\.(?:1[6-9]|2\d|3[0-1])(?:\.\d{1,3}){2})(?:[1-9]\d?|1\d\d|2[01]\d|22[0-3])(?:\.(?:1?\d{1,2}|2[0-4]\d|25[0-5])){2}(?:\.(?:[1-9]\d?|1\d\d|2[0-4]\d|25[0-4]))|(?:(?:[a-z\5.1/en/analysing-spatial-information.html">x{00a1}-\5.1/en/analysing-spatial-information.html">x{ffff}0-9]+-?)*[a-z\5.1/en/analysing-spatial-information.html">x{00a1}-\5.1/en/analysing-spatial-information.html">x{ffff}0-9]+)(?:\.(?:[a-z\5.1/en/analysing-spatial-information.html">x{00a1}-\5.1/en/analysing-spatial-information.html">x{ffff}0-9]+-?)*[a-z\5.1/en/analysing-spatial-information.html">x{00a1}-\5.1/en/analysing-spatial-information.html">x{ffff}0-9]+)*(?:\.(?:[a-z\5.1/en/analysing-spatial-information.html">x{00a1}-\5.1/en/analysing-spatial-information.html">x{ffff}]{2,})))(?::\d{2,5})?(?:/[^\s]*)?$_iuS
[MYSQL] pobierz, plaintext

https://mathiasbynens.be/demo/url-regex
Go to the top of the page
+Quote Post
SmokAnalog
post 13.01.2018, 15:18:50
Post #3





Grupa: Zarejestrowani
Postów: 1 707
Pomógł: 266
Dołączył: 3.07.2012
Skąd: Poznań

Ostrzeżenie: (0%)
-----


Odpowiedź na to pytanie brzmi: nie ma idealnego wzorca do wyciągania URL-i, bo standard URL jest skomplikowany. Najlepsze co możesz zrobić, to poszukać w Google "url regex" i samemu wybrać taki, który jest Twoim zdaniem wystarczający. Ja raczej nie stosuję tych długaśnych, bo nie za bardzo widzę powód. Jak coś się zaczyna od protokołu i potem w miarę wygląda jak URL, to jestem skłonny przygarnąć to do rodziny rzekomych URL-i. A że mogą się zdarzyć przebierańcy, no cóż.

Powiedz jeszcze skąd wyciągasz te URL-ki. Jeśli z artykułów czy książek, to już na pewno nie warto się bawić w skomplikowane wzorce, bo raczej nikt tam nie wrzucił prawie-URL-a. Jeśli z jakiegoś źródła HTML, to zastanów się czy raczej nie chodzi Ci o wyciągnięcie atrybutów href z HTML-a. Wtedy zabrałbym się do tego zupełnie inaczej.

Podsumowując: daj więcej szczegółów, to obmyślimy jakąś wystarczająco dobrą strategię.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 7.07.2025 - 17:00