Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [linux] Wygrepowanie URLi do obrazów z pliku HTML
DNMX
post 20.10.2022, 12:24:50
Post #1





Grupa: Zarejestrowani
Postów: 127
Pomógł: 0
Dołączył: 18.09.2021

Ostrzeżenie: (0%)
-----


Nie wiem, czy to dobry dział i czy dobrą metodą (linuxowa konsola) próbuję zrealizować to zadanie.

Czy ktoś z Was ma pod ręką regexp/polecenie dla grepa, żeby z pliku .html wygrepować urle (wartość atrybutu src dla <img>) z pliku HTML? Googlowałem ale najlepsze rozwiązanie jakie znalazłem, wykłada się w przypadku, gdy w jednej linii pliku znajduje się kilka URLi
Go to the top of the page
+Quote Post
nospor
post 20.10.2022, 14:05:31
Post #2





Grupa: Moderatorzy
Postów: 36 440
Pomógł: 6290
Dołączył: 27.12.2004




Przy zalozeniu ze twoje url zaczynaja sie od http:// to

grep -ohP '<img src="(.*?)"' file.html | grep -ohP 'https?://([a-z\-\/]*\.?)*'


--------------------

"Myśl, myśl, myśl..." - Kubuś Puchatek || "Manual, manual, manual..." - Kubuś Programista
"Szukaj, szukaj, szukaj..." - Kubuś Odkrywca || "Debuguj, debuguj, debuguj..." - Kubuś Developer

Go to the top of the page
+Quote Post
DNMX
post 20.10.2022, 16:32:44
Post #3





Grupa: Zarejestrowani
Postów: 127
Pomógł: 0
Dołączył: 18.09.2021

Ostrzeżenie: (0%)
-----


Nie zaczyna się, zawiera cyferki w nazwie domeny i "podłogę" w nazwie pliku. Zmodyfikowałem i zosatwiam dla potomnych:
Kod
grep -ohP 'src="(.*?)"' index.html | grep -ohP 'https?://([0-9a-z\-\_\/]*\.?)*'

Dzięki!
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 28.03.2024 - 12:57