Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> "Czytanie" treści MS Worda
djcinek
post
Post #1





Grupa: Zarejestrowani
Postów: 8
Pomógł: 0
Dołączył: 21.01.2003
Skąd: 51° 25' 0N | 22° 26' 60E | 169 mnpm

Ostrzeżenie: (0%)
-----


Czolem,

Mam taki problem - otoz rozchodzi sie o mozliwosc wczytania tresci pliku MS Word do bazy danych. Jak mialoby to dzialac:

1. uzytkownik wybiera plik przyklad.doc, zatwierdza
2. skrypt pobiera plik z lokalnego dysku, nastepnie kopiuje na serwer, oraz "czyta" jego tresc i umieszcza ja w bazie.

Po co to zamieszanie - szukanie slowa w tresci plikow lezacych w n-katalogow moze byc czasochlonne, szukanie w bazie zajmie chwile, dostane w odpowiedzi konkretna nazwe konkretnego pliku na podstawie skopiowanej tresci.

Czy spotkaliscie sie moze z jakims rozwiazaniem takiego problemu?

Bede wdzieczny za informacje,
pozdrawiam
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 5)
jol.us_
post
Post #2





Grupa: Zarejestrowani
Postów: 132
Pomógł: 0
Dołączył: 10.12.2003
Skąd: Kraków

Ostrzeżenie: (0%)
-----


Mialem podobny problem, niestety nie ma mozliwosci odczytu samego pliku... przynajmniej ja takowej nie znalazlem :|

Rozwiazaniem moze sie okazac narzedzie w stylu HTML Area (http://www.interactivetools.com/products/htmlarea/), ktore przyjmuje bezposrednie przeklejanie z dokumentow do pola tekstowego z zachowaniem stylow tekstu.
Wada rozwiazania: HTML Area dziala jedynie pod IE.


--------------------
run Forest run ...
Go to the top of the page
+Quote Post
revyag
post
Post #3





Grupa: Przyjaciele php.pl
Postów: 2 258
Pomógł: 16
Dołączył: 21.09.2004
Skąd: Kielce

Ostrzeżenie: (0%)
-----


Jest wersja beta, która obsługuje więcej przeglądarek.


--------------------
-------------

------
Go to the top of the page
+Quote Post
orson
post
Post #4





Grupa: Zarejestrowani
Postów: 548
Pomógł: 2
Dołączył: 19.07.2003

Ostrzeżenie: (0%)
-----


witam ...

a szukales w manualu questionmark.gif
http://www.php.net/manual/pl/ref.com.php
w samplach jest nawet przykladowa klasa przeksztalcajaca w locie doci do rtf ... problem jest taki ze dziala raczej na win32 ... i musisz miec worda of corz ... mozesz probowac odpalic przez dcom albo przez rpc na serwerze z *xem ale nie obejdzie sie bez drugiej maszyny w poblizu serwera z zainstalowanym wordem ... i zmian w konfigu serwera...

powodzenia


--------------------
Computer games don't affect kids; I mean if <span style="font-weight: bold;">Pac Man</span> affected us as kids,we would all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music.
Go to the top of the page
+Quote Post
nocnyMark()
post
Post #5





Grupa: Zarejestrowani
Postów: 50
Pomógł: 0
Dołączył: 26.04.2004

Ostrzeżenie: (0%)
-----


mysle ze sam pomysl rozwiazania problemu przeszukiwania jest dosc klopotliwy, bo:

- baza danych musiala by miec caly czas aktualna liste plikow i ich zawartosci.
(uzytkownicy musieliby wszystkie pliki albo wrzucac "przez" baze danych na dysk, albo skrypty musialy by dosc czesto odswiezac drzewo plikow)

- w taki sposob, baze zapychamy dokladna kopia danych, ktore juz w jedno miejsce sa wgrane - tracimy przynamniej 1.5 razy wiecej miejsca niz ten plik worda moglby zajmowac na dysku, bez tego skryptu.

tak wiec, wg mnie, potrzeba budowania takiego rozwiazania, musiala by przekroczyc koszty ktore sa z tym zwiazane (co najmniej te dwa co podalem)

------------------------

a co do rozwiazania, to zaczal bym od poszukania jakiegos konwertera doc2txt [jak pogoglujesz wpisujac doc2txt to wyskoczy kilka],
moze byc oparty o skrypt uruchamiany przez serwer www, a takze byc programem zewnetrzym, dzialajacym pod linuxem lub dosem. oba typy konwertera da sie wywolac z php, przekazac zrodlo i przeczytac wynik.

potem wynik w txt spokojnie mozna wrzucac do bazy i przeszukiwac.
Go to the top of the page
+Quote Post
orson
post
Post #6





Grupa: Zarejestrowani
Postów: 548
Pomógł: 2
Dołączył: 19.07.2003

Ostrzeżenie: (0%)
-----


witam ...

w niektorych rozwiazaniach analizowania dokumentow moze byc bardzo przydatne ... w wewnetrznej sieci dla ktorej robilem zarzadzanie zasobami, analizowane sa wszystkie pliki doc, xls, i maile przechowywane na serwerach firmowych [active directory - udzial "dokumenty" z podfolderami userow/dzialow] oraz na dyskach userow [wybrane katalogi - ustalane odgornie] ... w bazach danych [ klaster mssql ] przechowywane sa pliki, 5 poprzednich wersji pliku [w opcjach administrator moze dla szczegolnie waznych danych ustawic archiwizacje kazdej wersji], sumy crc kazdej wersji oraz sciezki dla kazdej kopii pliku ... pliki sa zbierane co 20 minut [albo czesciej] i jezeli jakis sie zmienil to jest kopiowany do bazy, po aktualizacji pliku glownego kazdy plik w sieci jest aktualizowany [dosc skomplikowane zarzadzanie ale dziala]... przez interfejs www [przegladarka lub form na pulpicie - active desktop (bajerancko to wyglada - result laduje sie do iframe prosto na pulpit)] mozna przeprowadzac wyszukiwanie pelno textowe wraz ze score oraz wyszukiwaniem wyrazow podobnych ... system dziala z win98 [niektorych funkcji niema ale podstawowe sa], winnt oraz unixami ... bardzo usprawnia dzialanie firmy ... pod warunkiem oczywiscie ze jest co analizowac ... dla jarzyniaka sie nie nadaje ...

pozdrawiam


--------------------
Computer games don't affect kids; I mean if <span style="font-weight: bold;">Pac Man</span> affected us as kids,we would all be running around in darkened rooms, munching magic pills and listening to repetitive electronic music.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 21.08.2025 - 17:35