![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 50 Pomógł: 0 Dołączył: 23.11.2004 Ostrzeżenie: (0%) ![]() ![]() |
Musze zrobić skrypt który liczy słowa w dokukmentach i ...
nie ma problemu jeśli jest to txt lub rtf ale można jakoś policzyć słowa w wordzie? może php ma wbudowane jakieś funkcje współpracujące z wordem ktoś ma jakiś pomysł od której strony to ugryźć (IMG:http://forum.php.pl/style_emoticons/default/questionmark.gif) może jakiś konwerter doc do txt ? Ten post edytował hab 10.04.2006, 15:42:21 |
|
|
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 1 012 Pomógł: 109 Dołączył: 26.09.2003 Skąd: nexis.pl Ostrzeżenie: (0%) ![]() ![]() |
Osobiście nie słyszałem o takim konwerterze i wątpię, żeby istniał taki z poziomu php (realtime). Jeżeli serwer stoi pod WINDOWS to da się to zrobić za pomocą programu WORD i dołączając do tego MAKRA.
|
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 1 660 Pomógł: 13 Dołączył: 9.06.2004 Skąd: Wrocław i okolice Ostrzeżenie: (0%) ![]() ![]() |
Skorzystaj z tych stron:
converter doc 2 html doc 2 txt -- || -- A co do liczenia słów:
strona |
|
|
![]()
Post
#4
|
|
Grupa: Zarejestrowani Postów: 25 Pomógł: 0 Dołączył: 6.04.2006 Ostrzeżenie: (0%) ![]() ![]() |
Cytat(hab @ 2006-04-10 11:58:55) Musze zrobić skrypt który liczy słowa w dokukmentach i ... nie ma problemu jeśli jest to txt lub rtf ale można jakoś policzyć słowa w wordzie? może php ma wbudowane jakieś funkcje współpracujące z wordem ktoś ma jakiś pomysł od której strony to ugryźć (IMG:http://forum.php.pl/style_emoticons/default/questionmark.gif) może jakiś konwerter doc do txt ? ktoś Ci zelecił to zadanie (IMG:http://forum.php.pl/style_emoticons/default/questionmark.gif) to jest niemożliwe policzyć tak słowa jak word. word ma błędy i źle liczy słowa, tak więc to co masz napisane w dokumencie worda przy ilość słów będzie inna niż policzysz ją Ty (oczywiście w niektórych przypadkach). |
|
|
![]()
Post
#5
|
|
Grupa: Zarejestrowani Postów: 1 470 Pomógł: 75 Dołączył: 21.09.2005 Skąd: że znowu Ostrzeżenie: (0%) ![]() ![]() |
a jakie to niby błędy przy liczeniu słów ma word? co to za problem rozbić całość na na podstawie odstępów(spacji, tabulatorów, przejść do nowej lini, myślników itp)(IMG:http://forum.php.pl/style_emoticons/default/questionmark.gif) W tym aspekcie word akurat nie ma błędów bo raczej ciężko byłoby tu o błąd.
|
|
|
![]()
Post
#6
|
|
Grupa: Zarejestrowani Postów: 25 Pomógł: 0 Dołączył: 6.04.2006 Ostrzeżenie: (0%) ![]() ![]() |
Cytat(devnul @ 2006-04-11 18:27:16) a jakie to niby błędy przy liczeniu słów ma word? co to za problem rozbić całość na na podstawie odstępów(spacji, tabulatorów, przejść do nowej lini, myślników itp)(IMG:http://forum.php.pl/style_emoticons/default/questionmark.gif) W tym aspekcie word akurat nie ma błędów bo raczej ciężko byłoby tu o błąd. mylisz się po 100-kroć. word ma błędy w zliczaniu słów. np w zagnieżdżonych tabelach nie zlicza ich poprawnie. mieliśmy w firmie projekt do zrobienia. ludzie nie chcieli go wziąć, bo nie zliczał tak samo jak word - zliczał lepiej. |
|
|
![]()
Post
#7
|
|
Grupa: Zarejestrowani Postów: 1 660 Pomógł: 13 Dołączył: 9.06.2004 Skąd: Wrocław i okolice Ostrzeżenie: (0%) ![]() ![]() |
@devnul : nie możesz tak poprostu rozbić stringa na znaki odstępów. Policz słowa 'Twoim' sposobem w takim ciągu:
'Wiceszef klubu Samoobrony Janusz Maksymiuk , który brał udział w rozmowach ocenił , że deklaracja programowa jest " praktycznie uzgodniona " . ' Policzy Ci wszystkie przecinki itp. policzy także pojedyńcze litery, które wyrazami raczej nie są. |
|
|
![]()
Post
#8
|
|
Grupa: Zarejestrowani Postów: 1 470 Pomógł: 75 Dołączył: 21.09.2005 Skąd: że znowu Ostrzeżenie: (0%) ![]() ![]() |
Cytat(TomASS @ 2006-04-11 22:34:11) @devnul : nie możesz tak poprostu rozbić stringa na znaki odstępów. Policz słowa 'Twoim' sposobem w takim ciągu: 'Wiceszef klubu Samoobrony Janusz Maksymiuk , który brał udział w rozmowach ocenił , że deklaracja programowa jest " praktycznie uzgodniona " . ' Policzy Ci wszystkie przecinki itp. policzy także pojedyńcze litery, które wyrazami raczej nie są. @TomASS: Oj czepiasz się i to strasznie, wystarczy tu wyrażenie regularne w którym uwzglęnisz tylko znaki będące literami i bedziesz dopasowywał każdy pojedynczy wyraz (czyli też przecijnek liczbe itp) z wyrażęniem regularnym jesli pasuje to doliczy, jeśli nie to nie doliczy danego wyrazu do sumy wyrazów w tekscie, a co do pojedynczych liter to jednak są one wyrazami np wyrazem jest "i", "a" "u" i to akurat jest poprawne. a przedstawiony przezemnie model był przykładowy, a nie szczegółowy, zauważ ze nie dałem tam żadnego kodu. @3rdeye|: być moze faktycznie word ma jakieś problemy ze zliczaniem w bardziej skomplikowanych strukturach (to też pewnie zależy od jego wersji), ale jestem ciekaw do czego takie zliczanie z poziomu php moze służyć w praktyce, może mnie oświecisz? Ten post edytował devnul 11.04.2006, 21:53:27 |
|
|
![]()
Post
#9
|
|
Grupa: Zarejestrowani Postów: 1 660 Pomógł: 13 Dołączył: 9.06.2004 Skąd: Wrocław i okolice Ostrzeżenie: (0%) ![]() ![]() |
A widziałeś kod z początku dyskusji (IMG:http://forum.php.pl/style_emoticons/default/tongue.gif)
Jak sprawe tak postawiłeś, to masz rację - zgadzam się z Tobą bo tak należy to zrobić jak piszesz. (IMG:http://forum.php.pl/style_emoticons/default/smile.gif) |
|
|
![]()
Post
#10
|
|
Grupa: Zarejestrowani Postów: 1 470 Pomógł: 75 Dołączył: 21.09.2005 Skąd: że znowu Ostrzeżenie: (0%) ![]() ![]() |
tak widziałem kod z początku dyskusji, dlatego nie rozumiem skąd Twoja interpretacja mojego posta, była uproszczona bez wdawania się w szczeguły. co do rozwiąznia przedstawionego przez ciebie to jest przyzwoite, ale ja to jednak bym troszke inaczej zorganizował, no ale cóż, są gusta i guściki, każdemu nie dogodzisz (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg)
|
|
|
![]()
Post
#11
|
|
Grupa: Zarejestrowani Postów: 25 Pomógł: 0 Dołączył: 6.04.2006 Ostrzeżenie: (0%) ![]() ![]() |
to nie było liczone przez php. liczył to open office i przesyłał do php lub ew. do jakiegoś skryptu cgi zliczoną ilość znaków.
nie wiem jak to dokładnie działało, ale było piękne. takie rzeczy przydają się firmom od tłumaczeń. __ Bez klątw ActivePlayer |
|
|
![]()
Post
#12
|
|
Grupa: Zarejestrowani Postów: 1 470 Pomógł: 75 Dołączył: 21.09.2005 Skąd: że znowu Ostrzeżenie: (0%) ![]() ![]() |
hmm, nie wiem ja się nie znam na tłumaczeniach aż tak ale mi się wydaje ze do tłumaczeń to raczej słownik jest potrzebny niż ilość wyrazów w tekscie, no chyba że licza od przetłumaczonego słowa to co innego. ale jakoś dziwnie to by wyglądało, za słowo brać :|
|
|
|
![]()
Post
#13
|
|
Grupa: Zarejestrowani Postów: 295 Pomógł: 7 Dołączył: 26.03.2004 Skąd: Opole Ostrzeżenie: (0%) ![]() ![]() |
Pliki MSWord w wersjach office < office 2003 są blikami binarnymi i nie da sie do nich dobrać tak jak do zwykłych plików tekstowych. Podobno od Office 2003 pliki są zapisywane w formacie XML, ale też nie wiem jak się do tego dobrać. W przypadku open office wystarczy zmienic rozszerzenie pliku tekstowego na zip i otworzyć zipem - a w środku zobaczymy dokumenty XML (IMG:http://forum.php.pl/style_emoticons/default/smile.gif)
Natomiast pewnie jest mozliwy dostęp do całej funkcjonalności worda poprzez technologię obiektów COM (pod serwerem windowsowym z zainstalowanym wordem) |
|
|
![]()
Post
#14
|
|
Grupa: Zarejestrowani Postów: 25 Pomógł: 0 Dołączył: 6.04.2006 Ostrzeżenie: (0%) ![]() ![]() |
płacisz za słowa, które tłumaczysz.
a dostęp do liczby słów (tej wordowej), jest tak jak napisał Indeo tylko poprzez komponety COM'a (lub czegoś innego w tej chwili nie pamiętam). dla dokumentu pojawia się poprostu zmienna word_count. biblioteki są płatne. |
|
|
![]() ![]() |
![]() |
Aktualny czas: 22.08.2025 - 21:45 |