Witam, chciałbym zaprezentować moją stronę, na której można skorzystaćz OCR (Optical Character Recognition). Nie ma żadnej filozofii - jedynie strona główna, na której znajduje się guzik do wczytywania plików (pliki wysyłane są AJAXem).
http://checkwords.pl
Twoja strona sypie błędem
"NIe podałeś adresu strony w linii 25 w pliku forum.php.pl"
Jakiego adresu strony nie podalem? Jakim pliku forum.php.pl?
Licze, ze sobie tylko zartujesz...
Jej, nie wiem jak moglem nie podac, chyba wina poniedzialku
To ze zapomniales podac, bywa czasami. Ale ze po moim poscie udawales wielkie zdziwienie o co chodzi..... Stary, ta plama na honorze nigdy ci nie zejdzie
To po splamieniu mojego honoru mozemy przejsc do oceny serwisu
PDF odczytało bardzo fajnie, ale nie mogę odczytać obrazka (screen samej zawartości z notatnika więc białe tło i czarne litery). Występuje nieoczekiwany błąd.
PS: Kohana?
Kohana kohana aplikacja zawiera az 2 akcje kontrolera welcome Nawet bez FW daloby rade to zrobic.
http://checkwords.pl/welcome/recognize_text - to mógłbyś jako owarunkować. Z ciekawości: na jakiej zasadzie to działa? Odpalany jest jakiś zewnętrzny soft?
Jak i po co?
nie rób proszę ze mnie idioty, przecież jeszcze przed chwilą rzucało błędem Kohany.
Aaa chodzi o tablice $_FILES, poprawilem to chwile przed wejsciem na ten link zeby zobaczyc co jest nie tak.
Edit:
przy okazji wyszla kohanowe niedorobienie: w funkcji File::mime_by_ext($ext) nalezy podawac rozszerzenie tylko z malych liter, w przypadku duzych liter nie zwraca mimetype, tylko null.
W jednym z poprzednich postów zapytałem na jakiej zasadzie działa rozpoznawanie tekstu - uchylisz rąbka tajemnicy?
PS: Co do Kohany to nie kop konającego
Dziala to na zasadzie ogolnodostepnych w sieci algorytmow, od siebie nic nie dodalem, moze lekko zmienilem parametry bo IMO wtedy dziala lepiej. Mialem tez kiedys rozpoznawanie twarzy i porownywanie ich z baza danych mordek, zeby znajdowac delikwenta, ale przy okazji awarii dysku twardego poszlo wpizdu, nie bylo to warte tyle, ile chcieli za odzyskanie danych.
Co do algorytmu:
Najpierw trzeba zrobic matryce, na ktorej beda tylko kolory czarny i bialy (czarny - tekst, bialy - tlo). Pozniej trzeba grafike podzielic na linie na zasadzie procentowego dopasowania do wzorca, kazda linie dzieli sie w pionie na kolumny tez na zasadzie bialych przestrzeni i otrzymuje sie literki, ktore trzeba dopasowac wedlug wzorca - tutaj najgorsza jest zastosowana czcionka.
Czytasz jakieś konkretne fonty? Tekst nie może być przekręcony?
Bo moich dwóch obrazków nie zczytało.
Fonty zrzucone do png jakims tam konwerterem.
No nie wierze, że robiłeś "własnego ocra". Ale chyba nie w php?...
Czemu po prostu nie użyć dobrego, sprawdzonego i darmowego softu, np https://code.google.com/p/tesseract-ocr/
?
I przydałoby się jakieś kolejkowanie, jak trochę "ludzi" na raz by zaczelo ocr'ować to zaraz Ci zabije serwer.
Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)