Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

 
Reply to this topicStart new topic
> [PHP] Unikalność tekstu
markuz
post
Post #1





Grupa: Zarejestrowani
Postów: 1 240
Pomógł: 278
Dołączył: 11.03.2008

Ostrzeżenie: (0%)
-----


Witam,

Posiadam bazę danych z tekstami (kawały). Każdy kawał może mieć maksymalnie 1000 znaków. W jaki sposób (najbardziej optymalny) sprawdzić czy kawał istnieje już w bazie danych? Może ktoś z Was posiada jakiś fajny pomysł? Chodzi o to, że nawet jeżeli kawał nieco zmieni strukturę bądź np. będą w nim inne imiona itp. to aby nadal wykrywało iż kawał nie jest oryginalny.

Proszę o pomoc i opinie (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post
Damonsson
post
Post #2





Grupa: Zarejestrowani
Postów: 2 355
Pomógł: 533
Dołączył: 15.01.2010
Skąd: Bydgoszcz

Ostrzeżenie: (0%)
-----


levenshtein

Ten post edytował Damonsson 9.01.2014, 10:27:26
Go to the top of the page
+Quote Post
markuz
post
Post #3





Grupa: Zarejestrowani
Postów: 1 240
Pomógł: 278
Dołączył: 11.03.2008

Ostrzeżenie: (0%)
-----


A co jeśli w bazie będzie np. 10000 rekordów? Każdy tekst muszę pobrać i sprawdzić tą funkcją? To chyba nie jest najoptymalniejsze rozwiązanie (IMG:style_emoticons/default/smile.gif)
Go to the top of the page
+Quote Post
Damonsson
post
Post #4





Grupa: Zarejestrowani
Postów: 2 355
Pomógł: 533
Dołączył: 15.01.2010
Skąd: Bydgoszcz

Ostrzeżenie: (0%)
-----


Wpisz sobie w google to co dostałeś + MySQL.

Niedługo zaczniecie zakładać tematy typu "jak zrobić siku".
A na odpowiedź "kibel", odpiszecie, "gdzie takie coś znajdę i jak wygląda, czy przez to się sika?"

Możesz sobie zawężać wyniki, poprzez różne filtry jakie sobie wymyślisz (np długość stringu), ale docelowo i tak będziesz musiał porównać większość rekordów z bazy. Jak sobie inaczej wyobrażasz sprawdzenie unikalności, niż poprzez porównanie każdego rekordu z tym, który chcesz dodać?

http://stackoverflow.com/questions/4671378...htein-mysql-php
http://stackoverflow.com/questions/1390988...nction-in-mysql
http://stackoverflow.com/questions/3338889...t-by-similarity
http://stackoverflow.com/questions/5322917...trings-in-mysql

Ten post edytował Damonsson 9.01.2014, 10:51:18
Go to the top of the page
+Quote Post
markuz
post
Post #5





Grupa: Zarejestrowani
Postów: 1 240
Pomógł: 278
Dołączył: 11.03.2008

Ostrzeżenie: (0%)
-----


Dziękuję za wyczerpującą odpowiedź (IMG:style_emoticons/default/smile.gif)

Myślałem o różnych ułatwieniach typu pobieranie kilku-kilkunastu słów np. najczęściej występujących wraz z ich liczbą (coś ala tagi) i na podstawie tych słów sprawdzanie czy kawał już istnieje tak aby można to było zrobić za pomocą jednego polecenia SQL. Do tego potrzebna by była dodatkowa tabela, ale myślę, że taka tabela ułatwi pracę bazy danych.

Ten post edytował markuz 9.01.2014, 19:01:08
Go to the top of the page
+Quote Post

Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 23.08.2025 - 04:06