![]() |
![]() ![]() |
![]() |
![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 121 Pomógł: 0 Dołączył: 3.12.2008 Ostrzeżenie: (0%) ![]() ![]() |
Witam mam bazę danych w której są kluczowe 2 tabele X i Y. Rekordy z tych tabel tworzą informacje o piosenkach. Każda z tabel zawiera pola: tytuł i artysta typu VARCHAR. I teraz moje pytanie. Potrzebuje z tabeli X pobrać informacje o piosence (tytuł i artysta) i sprawdzić czy w tabeli Y jest ten utwór. Jak łatwo się domyślić mogą występować literówki itp. Ważne jest aby jeśli znajdzie się podobny rekord w tabeli Y to określić jego zgodność procentową z wzorem (wyliczana w dowolny sposó(IMG:style_emoticons/default/cool.gif) . Obie tabele mają po ok tabela Y może mieć do 1 000 000 rekordów. Za pomocą czego mogę taki zbiór przeszukiwać. Próbowałem sam napisać kod z wykorzystywaniem alrogytmi n-gramów do oceny podobieństwa. Ale podczas masowego wyszukiwania (mam zbiór 5 000 rek w tabeli X i sprawdź czy w tabeli Y też są) trwa strasznie długo (nie mówimy tu o 2-3 min). Jakie są najlepsze gotowe rozwiązania. Mam wrażenie że zrzucenie na php całej roboty jest błędem. Wogóle czy php i mysql to jest dobre połączenie do tego typu operacji ?
|
|
|
![]()
Post
#2
|
|
Grupa: Moderatorzy Postów: 8 989 Pomógł: 1550 Dołączył: 8.08.2008 Skąd: Słupsk/Gdańsk ![]() |
Poczytać o wyszukiwanie pełnotekstowym FULLTEXT
|
|
|
![]()
Post
#3
|
|
Grupa: Zarejestrowani Postów: 121 Pomógł: 0 Dołączył: 3.12.2008 Ostrzeżenie: (0%) ![]() ![]() |
mogę się mylić ale FULL TEXt nie określi mi procentowego podobieństwa (IMG:style_emoticons/default/questionmark.gif) rozumiem ze zwrócone wyniki miał bym już ręcznie przetwarzać za pomocą php (IMG:style_emoticons/default/questionmark.gif)
|
|
|
![]()
Post
#4
|
|
Grupa: Moderatorzy Postów: 4 362 Pomógł: 714 Dołączył: 12.02.2009 Skąd: Jak się położę tak leżę :D ![]() |
Może stricte procentowego nie, ale zobacz tutaj choćby http://dev.mysql.com/doc/refman/5.1/en/ful...l-language.html i zwróć uwagę na
a w szczególności co zwróci score (IMG:style_emoticons/default/smile.gif) |
|
|
![]() ![]() |
![]() |
Aktualny czas: 25.08.2025 - 08:49 |