![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 866 Pomógł: 32 Dołączył: 2.06.2004 Skąd: Wrocław Ostrzeżenie: (0%) ![]() ![]() |
Mam problem, musze wyciagnąć z plików HTML "treść", pozbyć się wszystkich znaczników linków image'ów itp. Pozostwic wyłącznie to co jest najwazniejsze na stronie, czysty tekst. Wiem że znajduje sie poiedzy dwoma znacznikami. I sam bym sobie napisał prosty skrypt w php żeby to zrobił.
No ale niestety jest ALE... Tych pliów jest ponad 50 tyś. Juz nie wspomnę o tym że komp potrafi mi sie zwiesic jak to przeglądam. Chyba że znacie jakąś przegladarke zawartości dyku która bezproblemowo obsłuży (da sie przeglądać) ponad pół gigowy katalog z wyzej wspomnianą iloscią plików? Tak to dostałem i nawet nie wiem jak to podzielić, kiedy przejrzeć prawie sie nie da (IMG:http://forum.php.pl/style_emoticons/default/sad.gif) |
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 335 Pomógł: 0 Dołączył: 15.11.2003 Ostrzeżenie: (0%) ![]() ![]() |
Jeśli kazdy tekst jest podobnie umiejscowiony, miedzy identycznymi znacznikami. To najprosciej jest napisac skrypt w php lub maly programik w C/C++ czy czymś innym. Oczywiście wszystkiego od razu żaden program nie otworzy musialbys te 50 tys podzielic i szybko bys sie z tym uwinal. A po za tym twoj komp wiesza sie jak otwierasz kilkaset plików, ale jak program bedzie otwieral pokolei, jeden plik o danym rozszerzeniu to bedzie ok.
|
|
|
![]() ![]() |
![]() |
Aktualny czas: 9.10.2025 - 21:35 |