Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Wyciąganie treści z HTML, czy sa do tego programy?
sztosz
post
Post #1





Grupa: Zarejestrowani
Postów: 866
Pomógł: 32
Dołączył: 2.06.2004
Skąd: Wrocław

Ostrzeżenie: (0%)
-----


Mam problem, musze wyciagnąć z plików HTML "treść", pozbyć się wszystkich znaczników linków image'ów itp. Pozostwic wyłącznie to co jest najwazniejsze na stronie, czysty tekst. Wiem że znajduje sie poiedzy dwoma znacznikami. I sam bym sobie napisał prosty skrypt w php żeby to zrobił.

No ale niestety jest ALE... Tych pliów jest ponad 50 tyś.

Juz nie wspomnę o tym że komp potrafi mi sie zwiesic jak to przeglądam. Chyba że znacie jakąś przegladarke zawartości dyku która bezproblemowo obsłuży (da sie przeglądać) ponad pół gigowy katalog z wyzej wspomnianą iloscią plików? Tak to dostałem i nawet nie wiem jak to podzielić, kiedy przejrzeć prawie sie nie da (IMG:http://forum.php.pl/style_emoticons/default/sad.gif)
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
Chewolf
post
Post #2





Grupa: Zarejestrowani
Postów: 335
Pomógł: 0
Dołączył: 15.11.2003

Ostrzeżenie: (0%)
-----


Jeśli kazdy tekst jest podobnie umiejscowiony, miedzy identycznymi znacznikami. To najprosciej jest napisac skrypt w php lub maly programik w C/C++ czy czymś innym. Oczywiście wszystkiego od razu żaden program nie otworzy musialbys te 50 tys podzielic i szybko bys sie z tym uwinal. A po za tym twoj komp wiesza sie jak otwierasz kilkaset plików, ale jak program bedzie otwieral pokolei, jeden plik o danym rozszerzeniu to bedzie ok.
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 9.10.2025 - 21:35