![]() |
![]() |
![]() ![]()
Post
#1
|
|
Grupa: Zarejestrowani Postów: 243 Pomógł: 1 Dołączył: 1.06.2010 Ostrzeżenie: (0%) ![]() ![]() |
Od ostatniej zabawy syntezatorami mowy minęło już u mnie sporo czasu. Generalnie włączałem je sobie z All Playerem do czytania napisów na filmie i do dnia dzisiejszego nie wydawało mi się , że będę tego potrzebował w innych celach.
Szybko zajrzałem więc na stronę jedynego w miarę przyzwoitego polskiego syntezatora mowy o którym wiedziałem z poprzednich lat doświadczeń - program o nawie IVONA. Ku mojemu zdumieniu Soft Ivona bardzo się rozrósł. Możliwe stało się bowiem używanie syntezatorów mowy w aplikacjach www. W brew pozorom program można wykorzystać nie tylko dla nie słyszących. Pobawiłem się tym softem i nawet elegancko czyta e-maile. W każdym bądź rzazie daje link http://www.ivona.com/webreader.php Moim zdaniem jedyną wadą i głupotą producenta jest sposób licencjonowania programu . WADY które moim zdaniem są barierą wejścia w powszechny użytek A. cena z kosmosu - 1 907 zł za rok, przy czym liczba odsłuchań 2000 na miesiąc (rozbuj), B. abonament, C limit odsłuchań, D. synteza na zewnętrznym serwerze. - z wielu powodów nie dopuszczalne. Gdyby nie te przeszkody można byłoby z powodzeniem stosować te rozwiązania . Uważam też , że dużym minusem jest to , że synteza dźwięku odbywa się na serwerach producenta Ivona. Obawy moje rodzi , to, że w przypadku czytania poufnych informacji nie będą już poufne. Skąd ja mam wiedzieć czy transmisja nie zostanie w jakiś sposób podsłuchana lub zapisana po drugiej stronie ? Kolejnym problem jest to , że serwer musi oczekiwać na dobicie się do serwerów IVONA co nie zawsze skutkuje powodzeniem. Ja osobiście mocno ubolewam nad tym, że mimo, iż Polacy nie gęsi i swój język mają to nie mają nadal syntezatora mowy, który byłby w miarę na wysokim poziomie i za free. Wtedy można byłoby wykorzystać go jak bibliotekę i generować mowę w aplikacjach. No cóż mam nadzieję, że producent syntezatora mowy Ivona zejdzie na ziemię. Ciekawe zastosowania dla tego softu jakie przyszły mi do głowy w aplikacjach www: - odsłuchiwanie e-maili po kliknięciu w linka. - tworzenie animacji i gadających dynamicznie postaci animowanych np. interaktywny przewodnik po stronie www. - tworzenie interaktywnych pomocy np. przy zakupach w sklepach internetowych, - gadające reklamy, - alerty dźwiękowe w przypadku wykrycia błędu w formularzu , - oczywiste ,że dla niewidomych, - nauka języków dla obcokrajowców hehe, i masa innych zastosowań . Jak sądzicie czym generować mowę w PHP ? Ten post edytował fiasko 9.04.2011, 02:21:22 |
|
|
![]() |
![]()
Post
#2
|
|
Grupa: Moderatorzy Postów: 4 362 Pomógł: 714 Dołączył: 12.02.2009 Skąd: Jak się położę tak leżę :D ![]() |
Działa słabo, ponieważ największy problem to prawidłowe nagranie fonemów. Tu trzeba nieco zdać się na wyczucie. Poza tym Ty nagrywasz fonemy czy litery? To dwie różne rzeczy (IMG:style_emoticons/default/smile.gif) Najbliższe fonemów są głoski, ale to też nie do końca to samo. Podam Ci przykład zamiany na fonemy (IMG:style_emoticons/default/wink.gif)
Prządka: p-ż-o-n-d-k-a ("rz" to fonetycznie "ż", a "ą" zmiększa się zazwyczaj do "on") p-sz-o-n-d-k-a (jeśli przed "ż" wystąpią takie fonemy jak "p", "h", "k" to następuje zmiększenie do "sz") Jak widzisz, trzeba naprawdę dobrze znać język by poznać reguły kierujące. A co dopiero mówić gdy chesz jeszcze intonacje i akcenty wprowadzić. Tutaj musisz manikulować częstotliwością. Pytania charakteryzują się choćby tym, że częstotliwość się zwiększa im bliżej końca pytania, a w ostatnich wyrazach czy wręcz sylabach następuje znaczne jej zwiększenie, niemal wykładniczo. Do tego każdy fonem to nie ta sama długość w czasie, tutaj wspomniane wyczucie i samodzielny odsłuch wskazany. |
|
|
![]() ![]() |
![]() |
Aktualny czas: 8.10.2025 - 11:12 |