Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> Porównywanie tekstów
krzys_86
post 25.01.2012, 00:56:49
Post #1





Grupa: Zarejestrowani
Postów: 9
Pomógł: 0
Dołączył: 30.05.2011

Ostrzeżenie: (0%)
-----


Witam.

Podpowie ktoś jak w dobry sposób porównać podobieństwo tekstół, tzn w ilu % pasują do siebie?? Wiem że istnieje similar_text() a coś oprócz tego??

Potrzebuje porównać kilka tekstów i wybrać pasujące do siebie.

Pozdrawiam

Krzysztof
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi (1 - 4)
prowseed
post 25.01.2012, 02:53:08
Post #2





Grupa: Zarejestrowani
Postów: 433
Pomógł: 64
Dołączył: 29.01.2011
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


W jaki sposob chcesz je porownywac? Chcesz korzystac z algorytmow porownawczych?

Mozesz sobie rozbic teksty na olbrzymie tablice i porownywac literka po literce. Wartosc procentowa z wyniku chyba dasz rade policzyc.
Masz jeszcze odleglosc levenshteina: http://pl.wikipedia.org/wiki/Odległość_Levenshteina i wbudowana funkcja http://pl.php.net/manual/en/function.levenshtein.php
Jesli teksty po angielsku to mozna tez probowac soundex() i metaphone()



--------------------
Go to the top of the page
+Quote Post
krzys_86
post 25.01.2012, 15:05:03
Post #3





Grupa: Zarejestrowani
Postów: 9
Pomógł: 0
Dołączył: 30.05.2011

Ostrzeżenie: (0%)
-----


Dzięki za odpowiedź, pogłębie zaraz temat. Chodzi o to żeby za pomocą algorytmu porównać kilka tekstów (zajawki artykółów) i pogrupować je w podobne do siebie. Bardziej zależy mi na zbadaniu skuteczności takiego porównania smile.gif

Dzięki wielkie.
Go to the top of the page
+Quote Post
prowseed
post 25.01.2012, 21:43:34
Post #4





Grupa: Zarejestrowani
Postów: 433
Pomógł: 64
Dołączył: 29.01.2011
Skąd: Warszawa

Ostrzeżenie: (0%)
-----


Podobienstwa artykulow nie buduje sie na podstawie tresci, a na podstawie taggow/etykiet. Dołącz do każdej zajawki powiedzmy około 8 etykiet [zależnie od treści która prezentuje] i na ich podstawie buduj podobieństwa


--------------------
Go to the top of the page
+Quote Post
krzys_86
post 26.01.2012, 00:49:00
Post #5





Grupa: Zarejestrowani
Postów: 9
Pomógł: 0
Dołączył: 30.05.2011

Ostrzeżenie: (0%)
-----


tak wiem, najlepszym rozwiązaniem są tagi, ale tutaj chodzi mi bardziej o pracę badawczą jak taki algorytm się sprawdzi. Na dłuższą metę pozabijałoby to pewie serwery, ale do badania wystarczy mi kilka tekstów do porównania.
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Wersja Lo-Fi Aktualny czas: 19.07.2025 - 07:59