![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 137 Pomógł: 2 Dołączył: 2.07.2007 Skąd: Ostrzeszów Ostrzeżenie: (0%) ![]() ![]() |
Witam.
Chce wydobyć z PDFa tekst w PHPie. PDFy są generowane z worda, ale niestety wyskakują mi krzaki np. T?(IMG:style_emoticons/default/questionmark.gif) i??W?(IMG:style_emoticons/default/questionmark.gif)
Niektóre pdfy są ok odczyta, ale te z worda już nie. Korzystam z klasy http://www.phpclasses.org/browse/file/31030.html, ale też korzystałem z http://www.pdfparser.org/ co też krzaczy. Jest wiele klas podobnych do pdf2text, gdzie wszystkie wyłowują ten sam efekt ... Ten post edytował smiady 1.07.2015, 13:10:30 |
|
|
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 1 240 Pomógł: 278 Dołączył: 11.03.2008 Ostrzeżenie: (0%) ![]() ![]() |
Jeżeli masz serwer na linux`ie to możesz użyć pdftohtml, a następnie scrapować html`a wynikowego. Krótszej drogi nie znam ale może ktoś inny zna (IMG:style_emoticons/default/wink.gif)
|
|
|
![]() ![]() |
![]() |
Aktualny czas: 26.09.2025 - 09:02 |