Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Wysukiwarka, na tym forum i nie tylko
Sedziwoj
post
Post #1





Grupa: Zarejestrowani
Postów: 793
Pomógł: 32
Dołączył: 23.11.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Cała sprawa polega na tym, jaka jest minimalna długość szukanego słowa, oraz inne udziwnienia.
A chodzi mi w tej chwili o 3 literowe słowa, czy raczej skróty, jeśli poda się tylko go to nic nie znajdzie, a to trochę kiepski, gdy tych 3-literowych jest dość sporo w informatyce.
No i ogólnie kiedy powinno się i w jakim stopniu wymuszać na użytkowniku odpowiednią długość słowa, co powinno się ignorować itp. itd.
Np. zamiana wszystkich znaków oprócz alfanumerycznych na spacje, czasem to pomaga, a czasem nie, jak nazwa jest cos-tak co jest unikalne, to zamiana myślnika na spacje, powoduje że nie da się po tym wyszukać, a czasem takie widziałem praktyki... choć chyba jedną z gorszych wyszukiwarek pod tym względem ma Allegro.
Czy mamy wyszukiwarki co nie dopuszczając słów złożonych z samych cyfr...


P.S. Może dla tego jest tyle tematów o MVC, bo się o tym nie da znaleźć tematów <lol>
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 13)
Cysiaczek
post
Post #2





Grupa: Moderatorzy
Postów: 4 465
Pomógł: 137
Dołączył: 26.03.2004
Skąd: Gorzów Wlkp.




http://dev.mysql.com/doc/refman/5.0/en/ful...ine-tuning.html

i wszystko jasne ;]
Pozdrawiam
Go to the top of the page
+Quote Post
Sedziwoj
post
Post #3





Grupa: Zarejestrowani
Postów: 793
Pomógł: 32
Dołączył: 23.11.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Wiesz, takie stwierdzenie, to jakbyś powiedział "oni nie wiedzą z czego korzystają" ;]
Ja nie wnikam na czym coś stoi, tylko dlaczego tak działa.
Go to the top of the page
+Quote Post
Cezar708
post
Post #4





Grupa: Zarejestrowani
Postów: 1 116
Pomógł: 119
Dołączył: 10.05.2005
Skąd: Poznań

Ostrzeżenie: (0%)
-----


albo http://www.sphinxsearch.com/

... i wszystko jasne (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg)

Pozdrawiam
Go to the top of the page
+Quote Post
Sedziwoj
post
Post #5





Grupa: Zarejestrowani
Postów: 793
Pomógł: 32
Dołączył: 23.11.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


No i moderator powinien coś zareagować, bo koledzy nie piszą na temat ;P
A tak serio, to nawet nie podsyłajcie linki do takich stron, niedawno trochę je przeglądałem. Mi głównie chodzi dlaczego się nakłada pewne zasady na wyszukiwane frazy.
Go to the top of the page
+Quote Post
Cysiaczek
post
Post #6





Grupa: Moderatorzy
Postów: 4 465
Pomógł: 137
Dołączył: 26.03.2004
Skąd: Gorzów Wlkp.




Ok, jeśli się mylę, to mnie poprawcie, ale to chyba chodzi (w przypadku MySQL) o wielkość indeksu tabeli, a więc i wydajność takiego wyszukiwania. Jest nawet mowa o tym, że po zmianie minimalnej wartości dla wyszukiwania, należy przebudować indeksy. (IMG:http://forum.php.pl/style_emoticons/default/smile.gif)
Chyba, że w ogóle nie o tym rozmawiamy, ale w takie razie ja nie wiem... zarobiony jestem... niewyspany (IMG:http://forum.php.pl/style_emoticons/default/tongue.gif)

Pozdrawiam
Go to the top of the page
+Quote Post
wlamywacz
post
Post #7





Grupa: Zarejestrowani
Postów: 535
Pomógł: 27
Dołączył: 3.05.2005

Ostrzeżenie: (20%)
X----


Alllegro nie używam MySql.
Go to the top of the page
+Quote Post
Sedziwoj
post
Post #8





Grupa: Zarejestrowani
Postów: 793
Pomógł: 32
Dołączył: 23.11.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Cytat(wlamywacz @ 1.10.2008, 09:54:14 ) *
Alllegro nie używam MySql.


A co ma piernik do wiatraka?
Go to the top of the page
+Quote Post
wlamywacz
post
Post #9





Grupa: Zarejestrowani
Postów: 535
Pomógł: 27
Dołączył: 3.05.2005

Ostrzeżenie: (20%)
X----


Bo ja wiem... (IMG:http://forum.php.pl/style_emoticons/default/winksmiley.jpg)
Go to the top of the page
+Quote Post
athabus
post
Post #10





Grupa: Zarejestrowani
Postów: 898
Pomógł: 48
Dołączył: 2.11.2005
Skąd: Poznań

Ostrzeżenie: (0%)
-----


Tak z czystej ciekawości to jak działa wyszukiwarka na forum - w sensie fulltext search czy ma własny indeks? Bo ogólnie 3 znaki to jest dobre wyjście - pozwala wyeliminować w indeksie większość słów "przestankowych" i "łączników", ale tak jak pisze Sedziwoj w informatyce to trochę ogranicza wyszukiwanie (sam się kilka razy natknąłem na ten problem).

Ogólnie w indeksie swojej wyszukiwarki dodał bym opcję, aby ignorować 3 znakowe słowa za wyjątkiem zdefiniowanych przez administratora. Jeśli natomiast wyszukiwanie opiera się o fulltext to trochę kaplica, bo wierzę że zmiana domyślnych ustawień indexu na mniejszy o 1 znak oznaczałoby spore "dociążenie" bazy.

//BTW znacie jakieś dobre opensorucowe wyszukiwarki do instalacji na własnej witrynie - szukam czegoś podobnego, ale jakoś na razie nie mogę znaleźć nic co by mi podeszło - albo nie można tego łatwo zmodyfikować, albo jest słabo napisane itd.

Ten post edytował athabus 1.10.2008, 10:19:26
Go to the top of the page
+Quote Post
Sedziwoj
post
Post #11





Grupa: Zarejestrowani
Postów: 793
Pomógł: 32
Dołączył: 23.11.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Cytat(athabus @ 1.10.2008, 11:17:32 ) *
//BTW znacie jakieś dobre opensorucowe wyszukiwarki do instalacji na własnej witrynie - szukam czegoś podobnego, ale jakoś na razie nie mogę znaleźć nic co by mi podeszło - albo nie można tego łatwo zmodyfikować, albo jest słabo napisane itd.


Ogólnie z wyszukiwaniem pełnotekstowym to zależy co potrzebujesz, Lucene jest chyba najlepsza, ale to jedynie jak odpalisz pod Java, bo Zend Luucene na pewno odpada (hm może z symfony? będę musiał spróbować). Masz też te właśnie w bazach jak wspomniane w MySQL, a w PostgreSQL masz Tsearch2 (od wersji 8.3 nie jest tylko zewnętrznym "plugin'em").
Te poważniejsze mają słowniki itp. więc możesz je optymalizować pod względem ignorowanych słów itp. Osobiście wnikałem tylko tyle ile było mi potrzebne, więc niewiele. Jak używać w podstawowej formie.

No właśnie, co do długości słów, to po prostu słowa "przestankowe" "łączniki" wpisać w listę ignorowanych, a resztę przepuszczać, po zindeksowaniu przejrzeć co jest i ile razy i zmodyfikować filtry, w ten sposób będzie "mały" indeks i będzie zawsze użyteczny.
Go to the top of the page
+Quote Post
nospor
post
Post #12





Grupa: Moderatorzy
Postów: 36 557
Pomógł: 6315
Dołączył: 27.12.2004




Cytat
bo Zend Luucene na pewno odpada
czemu?
Go to the top of the page
+Quote Post
athabus
post
Post #13





Grupa: Zarejestrowani
Postów: 898
Pomógł: 48
Dołączył: 2.11.2005
Skąd: Poznań

Ostrzeżenie: (0%)
-----


Za nosporem czemu?

Akurat, jako że nie znalazłem gotowego rozwiązania z serp'ami, pajączkiem itp, które dałoby mi wszystkie funkcjonalności, których potrzebuję postanowiłem napisać coś samemu opierając się właśnie o Zend_Lucene - chętnie więc poznam słabe strony zanim zabrnę w ślepą uliczkę.
Go to the top of the page
+Quote Post
Sedziwoj
post
Post #14





Grupa: Zarejestrowani
Postów: 793
Pomógł: 32
Dołączył: 23.11.2006
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Jak to mówią niektóre osoby, można użyć szukaj ;P
Temat: ZendFramework_Zend_Search_Lucene
Pokrótce o co chodzi.

EDIT:
Dodam że czas się poprawia o połowę nawet jak nie ma xdebug'a na serwerze, ale to jest kropla w morzu potrzeb.

Ten post edytował Sedziwoj 1.10.2008, 12:30:55
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 23.08.2025 - 09:37