Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Przeszukiwanie dokumentów, indeksowanie
rip
post 3.09.2009, 11:46:01
Post #1





Grupa: Zarejestrowani
Postów: 17
Pomógł: 0
Dołączył: 5.04.2004

Ostrzeżenie: (0%)
-----


Witam,

Chciałbym stworzyć wyszukiwarkę dokumentów, która przeszukiwałaby dokumenty pod kątem wystąpienia danej frazy w dokumencie (zapewne po jakimś zindeksowaniu ich wcześniej). Czy jest to możliwe do zaimplementowania w php ? Może ktoś zna gotowe rozwiązania ?

pozdr.


--------------------
r.i.p.
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 9)
skowron-line
post 3.09.2009, 11:49:30
Post #2





Grupa: Zarejestrowani
Postów: 4 340
Pomógł: 542
Dołączył: 15.01.2006
Skąd: Olsztyn/Warszawa

Ostrzeżenie: (0%)
-----


Cytat(rip @ 3.09.2009, 11:46:01 ) *
przeszukiwałaby dokumenty

Jakich dokumentów questionmark.gif xml, txt, pdf, doc questionmark.gif


--------------------
I'm so fast that last night I turned off the light switch in my hotel room and was in bed before the room was dark - Muhammad Ali.
Peg jeżeli chcesz uprawiać sex to dzieci muszą wyjść, a jeżeli chcesz żeby był dobry ty też musisz wyjść - Al Bundy.

QueryBuilder, Mootools.net, bbcradio1::MistaJam
http://www.phpbench.com/
Go to the top of the page
+Quote Post
rip
post 3.09.2009, 11:56:50
Post #3





Grupa: Zarejestrowani
Postów: 17
Pomógł: 0
Dołączył: 5.04.2004

Ostrzeżenie: (0%)
-----


dokumenty: doc, pdf, txt, rtf


--------------------
r.i.p.
Go to the top of the page
+Quote Post
kfc4
post 3.09.2009, 14:16:23
Post #4





Grupa: Zarejestrowani
Postów: 195
Pomógł: 18
Dołączył: 7.10.2007

Ostrzeżenie: (0%)
-----


Hmm, jakby wczytać ich zawartość do bazy oraz założyć jakiś fulltext to czemu nie.
Go to the top of the page
+Quote Post
rip
post 4.09.2009, 06:55:01
Post #5





Grupa: Zarejestrowani
Postów: 17
Pomógł: 0
Dołączył: 5.04.2004

Ostrzeżenie: (0%)
-----


Cytat(kfc4 @ 3.09.2009, 15:16:23 ) *
Hmm, jakby wczytać ich zawartość do bazy oraz założyć jakiś fulltext to czemu nie.


Jakbym wiedział, że to będą pliki nie zawierające zbyt dużej ilości danych to jeszcze ok, ale mogą się zdarzyć pliki, które maja po kilkadziesiąt stron...


--------------------
r.i.p.
Go to the top of the page
+Quote Post
kfc4
post 4.09.2009, 16:57:14
Post #6





Grupa: Zarejestrowani
Postów: 195
Pomógł: 18
Dołączył: 7.10.2007

Ostrzeżenie: (0%)
-----


Dobra baza, dobre zapytanie, dobry serwer i zobacz jaki masz ficzer: podgląd plików bez pobierania ich smile.gif Z tego co się orientuje to musiał byś otworzyć każdy plik, sprawdzić jego zawartość - jak jest tym co jest poszukiwanie to go wyświetlić i tak w kółko. Jak nie chcesz całych dokumentów wwalać do bazy to może jakieś słowa kluczowe?
Go to the top of the page
+Quote Post
Riklaunim
post 4.09.2009, 17:03:15
Post #7





Grupa: Zarejestrowani
Postów: 640
Pomógł: 44
Dołączył: 8.02.2004

Ostrzeżenie: (0%)
-----


Indeksowanie binarnych plików to nie jest domena PHP, tym bardziej potrzebujesz narzędzia do efektywnego wyszukiwania pełnotekstowego, a baza danych nią nie jest. Na dużą i bardzo dużą skalę można użyć Solr. Na mniejszą np. Xapiana. Pierwszy Solr - wystawia RESTowe API więc w frontendzie PHP dogadasz się z nim curlem. Xapian ma swój własny binarny moduł do PHP udostępniający jego API. Z tego co wiem oba narzędzia mogą indeksować niektóre binarne typy plików. Co do reszty trzeba by stosować jakiś "preprocesor" przetwarzający plik do indeksowanego formatu (znajdą się jakieś Linuksowe/uniksowe narzędzia winksmiley.jpg)


--------------------
Biblioteki: Skrypty, CMS | Kurs PHP | Python
Go to the top of the page
+Quote Post
erix
post 4.09.2009, 17:16:19
Post #8





Grupa: Moderatorzy
Postów: 15 467
Pomógł: 1451
Dołączył: 25.04.2005
Skąd: Szczebrzeszyn/Rzeszów




Jeszcze było coś takiego, jak SphinX, też natywny moduł do PHP.


--------------------

ZCE :: Pisząc PW załączaj LINK DO TEMATU i TYLKO w sprawach moderacji :: jakiś błąd - a TREŚĆ BŁĘDU? :: nie ponaglaj z odpowiedzią via PW!
Go to the top of the page
+Quote Post
Riklaunim
post 4.09.2009, 18:34:13
Post #9





Grupa: Zarejestrowani
Postów: 640
Pomógł: 44
Dołączył: 8.02.2004

Ostrzeżenie: (0%)
-----


Sphinx działa generalnie w oparciu o dane z bazy danych (można też dawać mu dane przez XML, ale to inna historia).


--------------------
Biblioteki: Skrypty, CMS | Kurs PHP | Python
Go to the top of the page
+Quote Post
rip
post 5.09.2009, 10:21:38
Post #10





Grupa: Zarejestrowani
Postów: 17
Pomógł: 0
Dołączył: 5.04.2004

Ostrzeżenie: (0%)
-----


dzięki za sugestie, zorientuje się w możliwościacj i dam znać co i jak poszło...

pozdr.

Ten post edytował rip 5.09.2009, 10:22:16


--------------------
r.i.p.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 14.08.2025 - 13:53