Witaj Gościu! ( Zaloguj | Rejestruj )

Forum PHP.pl

> [JavaScript] Slownik wulgaryzmow
tzm
post
Post #1





Grupa: Zarejestrowani
Postów: 675
Pomógł: 58
Dołączył: 17.12.2013

Ostrzeżenie: (10%)
X----


No jak w temacie, zna ktos cos, widzieliscie, uzywaliscie?
Potrzebny mi do zabezpieczenia czatu.

edit: zeby drugiego tematu nie robic... ktos wie czy sie cos zmienilo w sprawie focus'a w chrome? za cholere go nie potrafie wylaczyc normalnymi sposobami typu: outline: none; dla webkit i zadne wynalazki z googla mi nie pomagaja. jakis fix? blur() z jquery tez nie pomaga.

@Dapi, dzieki. sekunde przez odswiezeniem tematu stackoverflow tez mi to podal (IMG:style_emoticons/default/smile.gif)

Ten post edytował tzm 24.08.2014, 18:45:51
Go to the top of the page
+Quote Post
 
Start new topic
Odpowiedzi
Dapi
post
Post #2





Grupa: Zarejestrowani
Postów: 186
Pomógł: 13
Dołączył: 7.08.2009

Ostrzeżenie: (0%)
-----


Co do wulgaryzmów, kiedyś robiłem na 3 pętlach przy systemie automatycznej moderacji komentarzy, skuteczność ponad 95%.

Gotowca nie zapodam, bo sporo siedziałem nad koncepsją i (marną wciąż) optymalizacją, ale idea jest taka:
1. zebrałem wszystkie wulgaryzmy jakie spotkałem w sieci razem z ich odmianami przez przypadki, osoby, liczby i wszystko wszystko.
2. Podzieliłem to na 3 tablice: przedrostki, wyrazy i przyrostki.
3. Przy sprawdzaniu łączę każdy z każdym (wychodzą patologie typu matkocipiajacych, ale ważne jest to, że mimo wszystko nie blokuje normalnych wyrazów).
4. Manewrójąc spacjami na początku wyrazu i na końcu wykluczam wyrazy typu "podsłuchuje", "wymachuje".
5. Jeśli wyraz pomyślnie przechodzi weryfikację do tej pory, męczę go wyrażeniami regularnymi zamieniającymi 0 na o, 1 na i, @ na a sh na sz, q na ku itd.
6. Dodatkowo regularnymi i podobieństwem stringów eliminują literówki i błędy ortograficzne, a także wklejki typu _, - czy zwykła spacja.

Rozwiązanie mało optymalne, bo czasu wykonywania nawet nie mierzyłem ze strachu, ale od 2 lat żadnego wulgaryzmu nie przepuściło (IMG:style_emoticons/default/smile.gif)



Możesz rzucić regułkę, że jeśli wykryty wulgaryzm to "podsłuchuje", wtedy go nie cenzuruje, ale zawsze są jeszcze "przesłuchuje", "wymachuje", "wymachuj"...
Wszystkiego razem z odmianami chyba nie ogarniesz.
Go to the top of the page
+Quote Post

Posty w temacie


Reply to this topicStart new topic
2 Użytkowników czyta ten temat (2 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 



RSS Aktualny czas: 27.12.2025 - 17:43