Drukowana wersja tematu

Kliknij tu, aby zobaczyć temat w orginalnym formacie

Forum PHP.pl _ Oceny _ Serwis OCR

Napisany przez: lukaskolista 14.04.2014, 14:19:21

Witam, chciałbym zaprezentować moją stronę, na której można skorzystaćz OCR (Optical Character Recognition). Nie ma żadnej filozofii - jedynie strona główna, na której znajduje się guzik do wczytywania plików (pliki wysyłane są AJAXem).

http://checkwords.pl

Napisany przez: nospor 14.04.2014, 14:21:15

Twoja strona sypie błędem
"NIe podałeś adresu strony w linii 25 w pliku forum.php.pl"

Napisany przez: lukaskolista 14.04.2014, 14:23:17

Jakiego adresu strony nie podalem? Jakim pliku forum.php.pl?

Napisany przez: nospor 14.04.2014, 14:24:07

Licze, ze sobie tylko zartujesz...

Napisany przez: lukaskolista 14.04.2014, 14:26:41

Jej, nie wiem jak moglem nie podac, chyba wina poniedzialku

Napisany przez: nospor 14.04.2014, 14:27:47

To ze zapomniales podac, bywa czasami. Ale ze po moim poscie udawales wielkie zdziwienie o co chodzi..... Stary, ta plama na honorze nigdy ci nie zejdzie

Napisany przez: lukaskolista 14.04.2014, 14:28:47

To po splamieniu mojego honoru mozemy przejsc do oceny serwisu

Napisany przez: phpion 14.04.2014, 14:31:25

PDF odczytało bardzo fajnie, ale nie mogę odczytać obrazka (screen samej zawartości z notatnika więc białe tło i czarne litery). Występuje nieoczekiwany błąd.

PS: Kohana?

Napisany przez: lukaskolista 14.04.2014, 14:32:22

Kohana kohana aplikacja zawiera az 2 akcje kontrolera welcome Nawet bez FW daloby rade to zrobic.

Napisany przez: phpion 14.04.2014, 14:34:17

http://checkwords.pl/welcome/recognize_text - to mógłbyś jako owarunkować. Z ciekawości: na jakiej zasadzie to działa? Odpalany jest jakiś zewnętrzny soft?

Napisany przez: lukaskolista 14.04.2014, 14:35:07

Jak i po co?

Napisany przez: phpion 14.04.2014, 14:38:27

nie rób proszę ze mnie idioty, przecież jeszcze przed chwilą rzucało błędem Kohany.

Napisany przez: lukaskolista 14.04.2014, 14:41:16

Aaa chodzi o tablice $_FILES, poprawilem to chwile przed wejsciem na ten link zeby zobaczyc co jest nie tak.

Edit:
przy okazji wyszla kohanowe niedorobienie: w funkcji File::mime_by_ext($ext) nalezy podawac rozszerzenie tylko z malych liter, w przypadku duzych liter nie zwraca mimetype, tylko null.

Napisany przez: phpion 14.04.2014, 14:48:22

W jednym z poprzednich postów zapytałem na jakiej zasadzie działa rozpoznawanie tekstu - uchylisz rąbka tajemnicy?

PS: Co do Kohany to nie kop konającego

Napisany przez: lukaskolista 14.04.2014, 14:52:43

Dziala to na zasadzie ogolnodostepnych w sieci algorytmow, od siebie nic nie dodalem, moze lekko zmienilem parametry bo IMO wtedy dziala lepiej. Mialem tez kiedys rozpoznawanie twarzy i porownywanie ich z baza danych mordek, zeby znajdowac delikwenta, ale przy okazji awarii dysku twardego poszlo wpizdu, nie bylo to warte tyle, ile chcieli za odzyskanie danych.

Co do algorytmu:
Najpierw trzeba zrobic matryce, na ktorej beda tylko kolory czarny i bialy (czarny - tekst, bialy - tlo). Pozniej trzeba grafike podzielic na linie na zasadzie procentowego dopasowania do wzorca, kazda linie dzieli sie w pionie na kolumny tez na zasadzie bialych przestrzeni i otrzymuje sie literki, ktore trzeba dopasowac wedlug wzorca - tutaj najgorsza jest zastosowana czcionka.

Napisany przez: #luq 14.04.2014, 18:07:35

Czytasz jakieś konkretne fonty? Tekst nie może być przekręcony?
Bo moich dwóch obrazków nie zczytało.

Napisany przez: lukaskolista 15.04.2014, 07:44:53

Fonty zrzucone do png jakims tam konwerterem.

Napisany przez: ano 17.04.2014, 18:25:13

No nie wierze, że robiłeś "własnego ocra". Ale chyba nie w php?...
Czemu po prostu nie użyć dobrego, sprawdzonego i darmowego softu, np https://code.google.com/p/tesseract-ocr/
?

I przydałoby się jakieś kolejkowanie, jak trochę "ludzi" na raz by zaczelo ocr'ować to zaraz Ci zabije serwer.