Forum PHP.pl > [linux] Wygrepowanie URLi do obrazów z pliku HTML

Pomoc - Szukaj - Użytkownicy - Kalendarz

Pełna wersja: [linux] Wygrepowanie URLi do obrazów z pliku HTML

Forum PHP.pl > Inne > Komputery i oprogramowanie

DNMX

20.10.2022, 12:24:50

Nie wiem, czy to dobry dział i czy dobrą metodą (linuxowa konsola) próbuję zrealizować to zadanie.

Czy ktoś z Was ma pod ręką regexp/polecenie dla grepa, żeby z pliku .html wygrepować urle (wartość atrybutu src dla <img>) z pliku HTML? Googlowałem ale najlepsze rozwiązanie jakie znalazłem, wykłada się w przypadku, gdy w jednej linii pliku znajduje się kilka URLi

nospor

20.10.2022, 14:05:31

Przy zalozeniu ze twoje url zaczynaja sie od http:// to

grep -ohP '<img src="(.*?)"' file.html | grep -ohP 'https?://([a-z\-\/]*\.?)*'

DNMX

20.10.2022, 16:32:44

Nie zaczyna się, zawiera cyferki w nazwie domeny i "podłogę" w nazwie pliku. Zmodyfikowałem i zosatwiam dla potomnych:

Kod

grep -ohP 'src="(.*?)"' index.html | grep -ohP 'https?://([0-9a-z\-\_\/]*\.?)*'

Dzięki!

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.