![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 17 Pomógł: 0 Dołączył: 5.04.2004 Ostrzeżenie: (0%) ![]() ![]() |
Witam,
Chciałbym stworzyć wyszukiwarkę dokumentów, która przeszukiwałaby dokumenty pod kątem wystąpienia danej frazy w dokumencie (zapewne po jakimś zindeksowaniu ich wcześniej). Czy jest to możliwe do zaimplementowania w php ? Może ktoś zna gotowe rozwiązania ? pozdr. |
|
|
![]()
Post
#2
|
|
Grupa: Zarejestrowani Postów: 4 340 Pomógł: 542 Dołączył: 15.01.2006 Skąd: Olsztyn/Warszawa Ostrzeżenie: (0%) ![]() ![]() |
przeszukiwałaby dokumenty Jakich dokumentów (IMG:style_emoticons/default/questionmark.gif) xml, txt, pdf, doc (IMG:style_emoticons/default/questionmark.gif) |
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 17 Pomógł: 0 Dołączył: 5.04.2004 Ostrzeżenie: (0%) ![]() ![]() |
dokumenty: doc, pdf, txt, rtf
|
|
|
![]()
Post
#4
|
|
Grupa: Zarejestrowani Postów: 195 Pomógł: 18 Dołączył: 7.10.2007 Ostrzeżenie: (0%) ![]() ![]() |
Hmm, jakby wczytać ich zawartość do bazy oraz założyć jakiś fulltext to czemu nie.
|
|
|
![]()
Post
#5
|
|
Grupa: Zarejestrowani Postów: 17 Pomógł: 0 Dołączył: 5.04.2004 Ostrzeżenie: (0%) ![]() ![]() |
|
|
|
![]()
Post
#6
|
|
Grupa: Zarejestrowani Postów: 195 Pomógł: 18 Dołączył: 7.10.2007 Ostrzeżenie: (0%) ![]() ![]() |
Dobra baza, dobre zapytanie, dobry serwer i zobacz jaki masz ficzer: podgląd plików bez pobierania ich (IMG:style_emoticons/default/smile.gif) Z tego co się orientuje to musiał byś otworzyć każdy plik, sprawdzić jego zawartość - jak jest tym co jest poszukiwanie to go wyświetlić i tak w kółko. Jak nie chcesz całych dokumentów wwalać do bazy to może jakieś słowa kluczowe?
|
|
|
![]()
Post
#7
|
|
Grupa: Zarejestrowani Postów: 640 Pomógł: 44 Dołączył: 8.02.2004 Ostrzeżenie: (0%) ![]() ![]() |
Indeksowanie binarnych plików to nie jest domena PHP, tym bardziej potrzebujesz narzędzia do efektywnego wyszukiwania pełnotekstowego, a baza danych nią nie jest. Na dużą i bardzo dużą skalę można użyć Solr. Na mniejszą np. Xapiana. Pierwszy Solr - wystawia RESTowe API więc w frontendzie PHP dogadasz się z nim curlem. Xapian ma swój własny binarny moduł do PHP udostępniający jego API. Z tego co wiem oba narzędzia mogą indeksować niektóre binarne typy plików. Co do reszty trzeba by stosować jakiś "preprocesor" przetwarzający plik do indeksowanego formatu (znajdą się jakieś Linuksowe/uniksowe narzędzia (IMG:style_emoticons/default/winksmiley.jpg) )
|
|
|
![]()
Post
#8
|
|
Grupa: Moderatorzy Postów: 15 467 Pomógł: 1451 Dołączył: 25.04.2005 Skąd: Szczebrzeszyn/Rzeszów ![]() |
Jeszcze było coś takiego, jak SphinX, też natywny moduł do PHP.
|
|
|
![]()
Post
#9
|
|
Grupa: Zarejestrowani Postów: 640 Pomógł: 44 Dołączył: 8.02.2004 Ostrzeżenie: (0%) ![]() ![]() |
Sphinx działa generalnie w oparciu o dane z bazy danych (można też dawać mu dane przez XML, ale to inna historia).
|
|
|
![]()
Post
#10
|
|
Grupa: Zarejestrowani Postów: 17 Pomógł: 0 Dołączył: 5.04.2004 Ostrzeżenie: (0%) ![]() ![]() |
dzięki za sugestie, zorientuje się w możliwościacj i dam znać co i jak poszło...
pozdr. Ten post edytował rip 5.09.2009, 10:22:16 |
|
|
![]() ![]() |
![]() |
Aktualny czas: 4.10.2025 - 08:38 |