Post
#1
|
|
|
Grupa: Zarejestrowani Postów: 243 Pomógł: 1 Dołączył: 1.06.2010 Ostrzeżenie: (0%)
|
Od ostatniej zabawy syntezatorami mowy minęło już u mnie sporo czasu. Generalnie włączałem je sobie z All Playerem do czytania napisów na filmie i do dnia dzisiejszego nie wydawało mi się , że będę tego potrzebował w innych celach.
Szybko zajrzałem więc na stronę jedynego w miarę przyzwoitego polskiego syntezatora mowy o którym wiedziałem z poprzednich lat doświadczeń - program o nawie IVONA. Ku mojemu zdumieniu Soft Ivona bardzo się rozrósł. Możliwe stało się bowiem używanie syntezatorów mowy w aplikacjach www. W brew pozorom program można wykorzystać nie tylko dla nie słyszących. Pobawiłem się tym softem i nawet elegancko czyta e-maile. W każdym bądź rzazie daje link http://www.ivona.com/webreader.php Moim zdaniem jedyną wadą i głupotą producenta jest sposób licencjonowania programu . WADY które moim zdaniem są barierą wejścia w powszechny użytek A. cena z kosmosu - 1 907 zł za rok, przy czym liczba odsłuchań 2000 na miesiąc (rozbuj), B. abonament, C limit odsłuchań, D. synteza na zewnętrznym serwerze. - z wielu powodów nie dopuszczalne. Gdyby nie te przeszkody można byłoby z powodzeniem stosować te rozwiązania . Uważam też , że dużym minusem jest to , że synteza dźwięku odbywa się na serwerach producenta Ivona. Obawy moje rodzi , to, że w przypadku czytania poufnych informacji nie będą już poufne. Skąd ja mam wiedzieć czy transmisja nie zostanie w jakiś sposób podsłuchana lub zapisana po drugiej stronie ? Kolejnym problem jest to , że serwer musi oczekiwać na dobicie się do serwerów IVONA co nie zawsze skutkuje powodzeniem. Ja osobiście mocno ubolewam nad tym, że mimo, iż Polacy nie gęsi i swój język mają to nie mają nadal syntezatora mowy, który byłby w miarę na wysokim poziomie i za free. Wtedy można byłoby wykorzystać go jak bibliotekę i generować mowę w aplikacjach. No cóż mam nadzieję, że producent syntezatora mowy Ivona zejdzie na ziemię. Ciekawe zastosowania dla tego softu jakie przyszły mi do głowy w aplikacjach www: - odsłuchiwanie e-maili po kliknięciu w linka. - tworzenie animacji i gadających dynamicznie postaci animowanych np. interaktywny przewodnik po stronie www. - tworzenie interaktywnych pomocy np. przy zakupach w sklepach internetowych, - gadające reklamy, - alerty dźwiękowe w przypadku wykrycia błędu w formularzu , - oczywiste ,że dla niewidomych, - nauka języków dla obcokrajowców hehe, i masa innych zastosowań . Jak sądzicie czym generować mowę w PHP ? Ten post edytował fiasko 9.04.2011, 02:21:22 |
|
|
|
![]() |
Post
#2
|
|
|
Grupa: Moderatorzy Postów: 4 362 Pomógł: 714 Dołączył: 12.02.2009 Skąd: Jak się położę tak leżę :D |
Działa słabo, ponieważ największy problem to prawidłowe nagranie fonemów. Tu trzeba nieco zdać się na wyczucie. Poza tym Ty nagrywasz fonemy czy litery? To dwie różne rzeczy (IMG:style_emoticons/default/smile.gif) Najbliższe fonemów są głoski, ale to też nie do końca to samo. Podam Ci przykład zamiany na fonemy (IMG:style_emoticons/default/wink.gif)
Prządka: p-ż-o-n-d-k-a ("rz" to fonetycznie "ż", a "ą" zmiększa się zazwyczaj do "on") p-sz-o-n-d-k-a (jeśli przed "ż" wystąpią takie fonemy jak "p", "h", "k" to następuje zmiększenie do "sz") Jak widzisz, trzeba naprawdę dobrze znać język by poznać reguły kierujące. A co dopiero mówić gdy chesz jeszcze intonacje i akcenty wprowadzić. Tutaj musisz manikulować częstotliwością. Pytania charakteryzują się choćby tym, że częstotliwość się zwiększa im bliżej końca pytania, a w ostatnich wyrazach czy wręcz sylabach następuje znaczne jej zwiększenie, niemal wykładniczo. Do tego każdy fonem to nie ta sama długość w czasie, tutaj wspomniane wyczucie i samodzielny odsłuch wskazany. |
|
|
|
fiasko Gadatliwa strona, samoczytające się emaile itp. itd. hbo i tvn 9.04.2011, 01:46:00
pedro84 A jaki jest cel tego tematu ( w dodatku w złym dzi... 9.04.2011, 01:56:18
ciekawskiii wlasnie chcialem zapytac, a jakie jest pytanie? 9.04.2011, 02:08:18
fiasko Cel informacyjny. Dział odpowiedni bo syntezę gen... 9.04.2011, 02:20:24
thek Czym? Napisać sobie samemu? Wbrew pozorom nie jes... 9.04.2011, 08:25:34
fiasko No wiesz nad czymś producent IVONA siedział przez ... 9.04.2011, 23:16:11
IceManSpy To już wiesz, dlaczego to tyle kosztuje
A raczej... 9.04.2011, 23:40:14
fiasko Dotarłem też do ciekawego artykułu poświęconemu ge... 9.04.2011, 23:49:42
IceManSpy CytatTroszkę przytłacza ilość zasad jakie rządzą s... 9.04.2011, 23:59:58
fiasko CytatZa to się płaci Możesz poszukać jakieś bazy,... 10.04.2011, 01:04:21
fiasko No wczoraj poczytałem te opracowania i kilka prac ... 10.04.2011, 11:26:09
thek Z bazą fonemów to nie przesadzaj. W języku polskim... 11.04.2011, 11:06:42
fiasko CytatTo co zrobiłem kiedyś w Matlabie nie działało... 11.04.2011, 13:40:11
thek @fiasko: wiem dobrze, że to nie jest banalna spraw... 11.04.2011, 19:36:33
fiasko Są już specjalne biblioteki do instalacji na serwe... 13.04.2011, 12:47:51
thek Owszem, link ok, ale zauważ jedno: w tym temacie c... 13.04.2011, 13:20:15
fiasko No widzisz - w samym PHP się nie da.
Próbuję... 13.04.2011, 22:52:12 ![]() ![]() |
|
Aktualny czas: 24.12.2025 - 10:32 |