Witam. Mam pytanie do bardziej doświadczonych osób. W jaki sposób realizujecie porównywanie dużej ilości danych?
Stoję przed zadaniem zrealizowania czegoś na wzór browser fingerprint (http://panopticlick.eff.org). Szukałem wzorcowych implementacji, jednak niewiele można znaleźć na ten temat. Jak ja widzę rozwiązanie problemu? Utworzenie osobnej tabeli na dane typu adres IP, zainstalowane wtyczki, fonty itp. Pobieranie wszystkich rekordów (przewiduję maksymalnie około 2500)? Dalej porównywanie funkcją similar_text(). Sam algorytm identyfikowania użytkownika widziałbym na zasadzie średniej ważonej – pewne dane są ważniejsze od innych. Jednak proces pobierania i porównywania tylu rekordów "w locie" nie napawa mnie optymizmem. Da się to rozwiązać lepiej?
Z góry dziękuję ze wszelkie pomysły.