Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> Określanie zgodności procentowej pół
kask18
post
Post #1





Grupa: Zarejestrowani
Postów: 121
Pomógł: 0
Dołączył: 3.12.2008

Ostrzeżenie: (0%)
-----


Witam mam bazę danych w której są kluczowe 2 tabele X i Y. Rekordy z tych tabel tworzą informacje o piosenkach. Każda z tabel zawiera pola: tytuł i artysta typu VARCHAR. I teraz moje pytanie. Potrzebuje z tabeli X pobrać informacje o piosence (tytuł i artysta) i sprawdzić czy w tabeli Y jest ten utwór. Jak łatwo się domyślić mogą występować literówki itp. Ważne jest aby jeśli znajdzie się podobny rekord w tabeli Y to określić jego zgodność procentową z wzorem (wyliczana w dowolny sposó(IMG:style_emoticons/default/cool.gif) . Obie tabele mają po ok tabela Y może mieć do 1 000 000 rekordów. Za pomocą czego mogę taki zbiór przeszukiwać. Próbowałem sam napisać kod z wykorzystywaniem alrogytmi n-gramów do oceny podobieństwa. Ale podczas masowego wyszukiwania (mam zbiór 5 000 rek w tabeli X i sprawdź czy w tabeli Y też są) trwa strasznie długo (nie mówimy tu o 2-3 min). Jakie są najlepsze gotowe rozwiązania. Mam wrażenie że zrzucenie na php całej roboty jest błędem. Wogóle czy php i mysql to jest dobre połączenie do tego typu operacji ?
Go to the top of the page
+Quote Post
wookieb
post
Post #2





Grupa: Moderatorzy
Postów: 8 989
Pomógł: 1550
Dołączył: 8.08.2008
Skąd: Słupsk/Gdańsk




Poczytać o wyszukiwanie pełnotekstowym FULLTEXT
Go to the top of the page
+Quote Post
kask18
post
Post #3





Grupa: Zarejestrowani
Postów: 121
Pomógł: 0
Dołączył: 3.12.2008

Ostrzeżenie: (0%)
-----


mogę się mylić ale FULL TEXt nie określi mi procentowego podobieństwa (IMG:style_emoticons/default/questionmark.gif) rozumiem ze zwrócone wyniki miał bym już ręcznie przetwarzać za pomocą php (IMG:style_emoticons/default/questionmark.gif)
Go to the top of the page
+Quote Post
thek
post
Post #4





Grupa: Moderatorzy
Postów: 4 362
Pomógł: 714
Dołączył: 12.02.2009
Skąd: Jak się położę tak leżę :D




Może stricte procentowego nie, ale zobacz tutaj choćby http://dev.mysql.com/doc/refman/5.1/en/ful...l-language.html i zwróć uwagę na
  1. SELECT id, MATCH (title,body) AGAINST ('Tutorial' IN NATURAL LANGUAGE MODE) AS score FROM articles
a w szczególności co zwróci score (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 25.08.2025 - 08:49