![]() |
![]() |
![]() ![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 243 Pomógł: 1 Dołączył: 1.06.2010 Ostrzeżenie: (0%) ![]() ![]() |
Od ostatniej zabawy syntezatorami mowy minęło już u mnie sporo czasu. Generalnie włączałem je sobie z All Playerem do czytania napisów na filmie i do dnia dzisiejszego nie wydawało mi się , że będę tego potrzebował w innych celach.
Szybko zajrzałem więc na stronę jedynego w miarę przyzwoitego polskiego syntezatora mowy o którym wiedziałem z poprzednich lat doświadczeń - program o nawie IVONA. Ku mojemu zdumieniu Soft Ivona bardzo się rozrósł. Możliwe stało się bowiem używanie syntezatorów mowy w aplikacjach www. W brew pozorom program można wykorzystać nie tylko dla nie słyszących. Pobawiłem się tym softem i nawet elegancko czyta e-maile. W każdym bądź rzazie daje link http://www.ivona.com/webreader.php Moim zdaniem jedyną wadą i głupotą producenta jest sposób licencjonowania programu . WADY które moim zdaniem są barierą wejścia w powszechny użytek A. cena z kosmosu - 1 907 zł za rok, przy czym liczba odsłuchań 2000 na miesiąc (rozbuj), B. abonament, C limit odsłuchań, D. synteza na zewnętrznym serwerze. - z wielu powodów nie dopuszczalne. Gdyby nie te przeszkody można byłoby z powodzeniem stosować te rozwiązania . Uważam też , że dużym minusem jest to , że synteza dźwięku odbywa się na serwerach producenta Ivona. Obawy moje rodzi , to, że w przypadku czytania poufnych informacji nie będą już poufne. Skąd ja mam wiedzieć czy transmisja nie zostanie w jakiś sposób podsłuchana lub zapisana po drugiej stronie ? Kolejnym problem jest to , że serwer musi oczekiwać na dobicie się do serwerów IVONA co nie zawsze skutkuje powodzeniem. Ja osobiście mocno ubolewam nad tym, że mimo, iż Polacy nie gęsi i swój język mają to nie mają nadal syntezatora mowy, który byłby w miarę na wysokim poziomie i za free. Wtedy można byłoby wykorzystać go jak bibliotekę i generować mowę w aplikacjach. No cóż mam nadzieję, że producent syntezatora mowy Ivona zejdzie na ziemię. Ciekawe zastosowania dla tego softu jakie przyszły mi do głowy w aplikacjach www: - odsłuchiwanie e-maili po kliknięciu w linka. - tworzenie animacji i gadających dynamicznie postaci animowanych np. interaktywny przewodnik po stronie www. - tworzenie interaktywnych pomocy np. przy zakupach w sklepach internetowych, - gadające reklamy, - alerty dźwiękowe w przypadku wykrycia błędu w formularzu , - oczywiste ,że dla niewidomych, - nauka języków dla obcokrajowców hehe, i masa innych zastosowań . Jak sądzicie czym generować mowę w PHP ? Ten post edytował fiasko 9.04.2011, 02:21:22 |
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Moderatorzy Postów: 4 362 Pomógł: 714 Dołączył: 12.02.2009 Skąd: Jak się położę tak leżę :D ![]() |
Z bazą fonemów to nie przesadzaj. W języku polskim jest TYLKO około 25 fonemów (nie pamiętam czy 24 czy 26 (IMG:style_emoticons/default/smile.gif) ) i z nich możesz składać wyrazy. To co musisz zrobić to tak naprawdę konwersja tekstu do zapisu fonemowego, a to zrobić nie tak znowu trudno. Jeśli tego nie potrafisz, nie ma co się nawet za trudniejsze rzeczy brać pod tym kątem ( akcenty czy intonacja ). Gdy to już zrobisz poprawnie to "sklejenie fonemów jest już tylko formalnością". To co zrobiłem kiedyś w Matlabie nie działało najgorzej, ale niestety od razu mówię, że nie działało idealnie, gdyż sa w języku polskie takie wyrazy, które są wyjątkami i ich pisownia nie do końca podlega zamianom według reguł. Znanym przykładem jest słowo "erzac", które wymawia się dokładnie tak jak pisownia, a więc nie "e-ż-a-c", ale "e-r-z-a-c"
|
|
|
![]() ![]() |
![]() |
Aktualny czas: 12.10.2025 - 03:21 |