[PHP]Pobieranie stringu z DOCX / DOC / PDF

[PHP]Pobieranie stringu z DOCX / DOC / PDF, jak wykonać?

casperii Zobacz profil	16.10.2018, 15:17:54 Post #1
Grupa: Zarejestrowani Postów: 681 Pomógł: 28 Dołączył: 14.08.2014 Ostrzeżenie: (0%)	Panowie przeglądając popularne serwisy o pracę , zauważyłem, że na podstawie uploadowanego CV uzupełnia się profil użytkownika. Czy ktoś z obecnych phpowców jest w stanie mi wytłumaczyć z jakiej biblioteki ów serwisy korzystają ?

Odpowiedzi

batman Zobacz profil	17.10.2018, 22:34:37 Post #2
Grupa: Moderatorzy Postów: 2 921 Pomógł: 269 Dołączył: 11.08.2005 Skąd: 127.0.0.1	Kiedyś opisałem na blogu jak wygląda parsowanie plików docx - https://archive.wilgucki.pl/2010/05/jak-odc...docx-w-php.html (niestety po kilku migracjach starego bloga, część zasobów zaginęła, inne wskazują na niepoprawną lokalizację, więc strona jest nieco rozjechana. Muszę to w końcu naprawić). Jest to nieco inne podejście niż w kodzie, który wkleiłeś, ale koniec końców i tak musisz przeparsować tekst, aby wyciągnąć dane. Jeśli format danych jest niezmienny, wystarczy napisać prosty parser bazujących na stałych elementach. Jeśli jednak chcesz parsować różne dokumenty, będziesz musiał pobawić się wyciąganie danych z tekstu. Z pomocą przyjdzie spaCy, bardzo prosta w użyciu biblioteka do nlp.

Posty w temacie

casperii [PHP]Pobieranie stringu z DOCX / DOC / PDF 16.10.2018, 15:17:54

werdan Daj przykład takiego serwisu. Jesteś pewien, że t... 16.10.2018, 20:12:39

casperii praca.pl , pracuj.pl możesz stworzyć swój profil ... 16.10.2018, 21:01:05

viking To zwykły xml spakowany 17.10.2018, 04:13:28

batman W przypadku docx (i innych pochodnych formatów) pl... 17.10.2018, 10:48:26

casperii @batman możesz podać przykład ? dla docx coś tak... 17.10.2018, 19:10:39

batman Kiedyś opisałem na blogu jak wygląda parsowanie pl... 17.10.2018, 22:34:37

markuz pdf2html 18.10.2018, 10:57:44

2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)

0 Zarejestrowanych:

Tryb wyświetlania: Przełącz na: Standardowy · Przełącz na: Linearny+ · Drzewo

Aktualny czas: 12.10.2025 - 08:45

Hosting zapewnia

Forum PHP.pl