Pomoc - Szukaj - Użytkownicy - Kalendarz
Pełna wersja: [funkcja] Uzupełnianie polskich znaków
Forum PHP.pl > Forum > Gotowe rozwiązania > Algorytmy, klasy, funkcje
Cosi*
Witam
Chciałbym przedstawić mój nowy projekt - funkcję uzupełniającą polskie znaki diakrytyczne w tekstach.Zgodnie z obowiązującymi trendami winksmiley.jpg funkcja dodająca polskie znaki jest statycznie wywoływaną metodą klasy zawierającej cały "silnik" programu.
Skrypt może znaleźć zastosowanie np. na forach dyskusyjnych, blogach i innych systemach wprowadzania tekstu, jak również w serwisach dla osób nie posiadających polskiego układu klawiatury.
W obecnym stadium program jest bardzo powolny, ze względu na duże rozmiary słownika - to wymaga optymalizacji.
Zapraszam do testowania,
Cosi
nospor
sie zamienia na sie a powinien na się winksmiley.jpg

A ogólnie ciekawy algorytm.
Cosi*
Cytat(nospor @ 12.09.2007, 13:12:08 ) *
ogólnie ciekawy algorytm.

Miło mi to słyszeć smile.gif
"sie" zamienia się na "sie", a "ze" na "ze", ponieważ takie słowa znajdują się w słowniku (swoją drogą co to jest "sie"?). Obecnie program korzysta z okrojonego słownika "kurnikowego", dołączonego standardowo do Linuksa. Żeby przyspieszyć pracę i zwiększyć trafność, planuję utworzenie własnego słownika, bazującego na słowach najczęściej występujących na stronach internetowych, ale to jest niestety syzyfowa praca...
nospor
Cytat
woją drogą co to jest "sie"
Ze jak? A ty z jakiego kraju pochodzisz?
Pisząc wypracowanie pomyliłem się....
Wracałem do domu i wywaliłem się....


się to zaimek zwrotny czy jakoś tak

Cytat
"ze" na "ze"
a czemu nie na "że" ?
viraptor
Cytat(nospor @ 12.09.2007, 12:31:13 ) *
Ze jak? A ty z jakiego kraju pochodzisz?

Właśnie o "sie", a nie "się" chodziło. http://www.kurnik.pl/slownik/sp.phtml?sl=si
sia, sią, sich, sie, siego, siej, siemu, sim, simi, sio - takie tam staropolskie wybryki winksmiley.jpg

Cytat(nospor @ 12.09.2007, 12:31:13 ) *
a czemu nie na "że" ?

Bo jak "spadl ze schodow", to nie "spadł że schodów" - już łapiesz? smile.gif
Daimos
a dlaczego sie, zamiast się? chyba częściej używa się "się" winksmiley.jpg
Cosi*
@viraptor: Dokładnie tak smile.gif Mówisz, że te rodzynki to staropolszczyzna? To by wiele tłumaczyło.

@my salsa: Obecny słownik nie uwzględnia częstości występowania słów w "internetczyźnie". Do tego zawiera takie perełki jak "Abelardów" albo "Abakanowiczów", które raczej nie są zbyt często używane. Dlatego potrzebna jest optymalizacja słownika, właśnie pod kątem częstości występowania słów. Już to zacząłem ale długa droga jeszcze przede mną...
nospor
Cytat
Bo jak "spadl ze schodow", to nie "spadł że schodów" - już łapiesz?
No to trzeba jeszcze wylapywac kontekst winksmiley.jpg

A na powaznie: z tym ze na ze to racja, ale sie to raczej na się powinno. Ale tak sie czepiam tylko smile.gif
doctor-ley
A może, by tak podzielić słownik alfabetycznie? Teoretycznie powinno to przyśpieszyć działanie programu... Na forum mogło by się to przydać, ale serwer musiałby byś strasznie mocny winksmiley.jpg
Cosi*
Też myślałem o takim rozwiązaniu smile.gif Wystarczy niewielka modyfikacja kodu, nawet skrypt dodawania do bazy ma już opcję "literka po literce". Generalnie optymalizacja jest głównym problemem, w zasadzie jedynym oprócz kwestii lepszego sortowania bazy (pod względem częstości występowania form). Być może nowy słownik rozwiąże oba problemy.
To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.
Invision Power Board © 2001-2025 Invision Power Services, Inc.