Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Odczytywanie zawartości plików .pdf, w celu zrobienia wyszukiwania po treści plików
sowiq
post
Post #1





Grupa: Zarejestrowani
Postów: 1 890
Pomógł: 339
Dołączył: 14.12.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Witam,
przymierzam się do zbudowania systemu download dla plików pdf. Z czasem będzie ich sporo, a chciałbym mieć opcję wyszukiwania po treści dokumentów. Oczywiście jest możliwość oprócz wysyłania pliku na serwer zapisywać też do bazy danych skopiowaną ręcznie treść, ale takie rozwiązanie nawet nie leżało koło usability.

Stąd moje pytania.
1. Czy da się za pomocą PHP z pliku .pdf odczytać treść? Wystarczy zwykły text/plain, bo funkcja ta jest potrzebna do zrobienia prostego wyszukiwania.
2. Jeśli jest taka opcja, to jaki ma na to wpływ zabezpieczenie pliku hasłem (np. zabezpieczenie przed kopiowaniem, drukowaniem itp.)?

Z góry dzięki za wskazówki.

Ten post edytował sowiq 9.04.2009, 16:01:15
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
osl
post
Post #2





Grupa: Zarejestrowani
Postów: 260
Pomógł: 41
Dołączył: 6.04.2009
Skąd: Gdańsk/okolice

Ostrzeżenie: (0%)
-----


zerknij może na Apache Tika, pozwala na wyciąganie treści (np. do indeksowania) z plików office, pdf i sporej liczby innych.
może Ci podpasuje (IMG:http://forum.php.pl/style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 9.10.2025 - 16:35