1
Синтезаторы речи
Автор RomanBorisov, 25 ноя 2012 01:25
Сообщений в теме: 9
#1
Отправлено 25 Ноябрь 2012 - 01:25
Товарищи, сколь скоро, по вашему мнению, различ. программы по синтезу речи смогут составить нам конкуренцию?....))))(((((
#2
Отправлено 26 Ноябрь 2012 - 03:10
Очень и очень не скоро, пока можно не напрягаться.
#3
Отправлено 26 Ноябрь 2012 - 06:34
Нас используют как образцы и выкинут... и будет умная программка сама все делать.. только данные вводи, кнопочки жми и выбирай... извращенцы заказчики будут синтезировать наши голоса и выйдут в свет такие дикторы как : Полищукишвили, Виноградосипов... и что еще хуже совмещать начнут муж с жен или вообще с животными... Найдите быстрее умника, желающего реализовать это и оторвите ему уши)))
#4
Отправлено 26 Ноябрь 2012 - 10:21
Ха, у нас в городе (Псков) уже появился ролик начитанный неким синтезатором. так что...началось)
Прикрепленные файлы
Сообщение отредактировал Вересов Евгений: 26 Ноябрь 2012 - 10:23
#5
Отправлено 26 Ноябрь 2012 - 11:11
Отрывать уши придётся как минимум паре этажей главного офиса Гугла. Которые упорнее всех занимаются данной разработкой.
У самой большой кибер компании самые большие возможности по использованию "подопытных". Все разговоры в системе Гугл-ток проходя через серверы компании анализируются, и используются как материал для изучения принципов построения речи, интонирования и т.д. различными субъектами.
Если у нас основной "говорильный сервис" это скайп, то Там, в штатах, это всё-таки Гугл-ток. И объёмы поступающих данных очень не маленькие.
Синтез речи, голосовой ввод, анализ и расшифровка речи - всё это ранее было под грифом секретности. И разработки не выходили "в мир". (Жалкие проги читалки и голосовой ввод СМС не в счёт.) :)/> Сейчас же, всё идёт к тому, что технология может выйти в массы. Но всё равно, думаю, рано говорить о том, что это может окончательно и бесповоротно заменить живых актёров, дикторов.
Думаю, пока поработаем:)/>
У самой большой кибер компании самые большие возможности по использованию "подопытных". Все разговоры в системе Гугл-ток проходя через серверы компании анализируются, и используются как материал для изучения принципов построения речи, интонирования и т.д. различными субъектами.
Если у нас основной "говорильный сервис" это скайп, то Там, в штатах, это всё-таки Гугл-ток. И объёмы поступающих данных очень не маленькие.
Синтез речи, голосовой ввод, анализ и расшифровка речи - всё это ранее было под грифом секретности. И разработки не выходили "в мир". (Жалкие проги читалки и голосовой ввод СМС не в счёт.) :)/> Сейчас же, всё идёт к тому, что технология может выйти в массы. Но всё равно, думаю, рано говорить о том, что это может окончательно и бесповоротно заменить живых актёров, дикторов.
Думаю, пока поработаем:)/>
#6
Отправлено 26 Ноябрь 2012 - 11:27
надо ресторанный бизнес открывать! или азс... чота надо думать короче)))))
#7
Отправлено 26 Ноябрь 2012 - 11:41
Нет! Нужен терминатор,чтобы тот сгонял в прошлое и поработал над предками умных умников))
#8
Отправлено 26 Ноябрь 2012 - 12:08
лицо им пописАл нафиг)))) зубодёром!
#9
Отправлено 26 Ноябрь 2012 - 12:15
Товарищ рассказывал, как был удивлён тем, что в Лос Анджелесе, в салоне Тойота, всяческие рекламные материалы на плазменных панелях были озвучены "бабой-роботом" и мол слушалось это круто и футуристично. Причём, это была синтезированная речь, а не актёрский закос.
Правда он считает, что мол, это пришло на смену дикторам, а я ему пытался донести, что это просто худ. приём такой:)/>
(Ну товарищ, не из нашей сферы.. поэтому пришлось пояснять):)/>
Правда он считает, что мол, это пришло на смену дикторам, а я ему пытался донести, что это просто худ. приём такой:)/>
(Ну товарищ, не из нашей сферы.. поэтому пришлось пояснять):)/>
Сообщение отредактировал Антон Симкин: 26 Ноябрь 2012 - 12:16
#10
Отправлено 26 Ноябрь 2012 - 17:01
мне как то пришёл заказ из фсб "института речевых технологий г Санкт-Петербург". В ТЗ было написано:
"Найти и записать текст (который был предоставлен) 50 этнических татар мужчин в возрасте от 30 до 50 лет."
Текст был несложным и безобидным но смысл был в перекрытии произношения максимума фонем.
Так что сии разработки ведутся и у нас. Правда это всё для СОРМ-1 - алгоритмизация выявления сигнатур голоса по этническому признаку, а этих признаков сотни.
А там где есть алгоритмы анализа - создание алгоритмов синтеза уже плёвое дело.
"Найти и записать текст (который был предоставлен) 50 этнических татар мужчин в возрасте от 30 до 50 лет."
Текст был несложным и безобидным но смысл был в перекрытии произношения максимума фонем.
Так что сии разработки ведутся и у нас. Правда это всё для СОРМ-1 - алгоритмизация выявления сигнатур голоса по этническому признаку, а этих признаков сотни.
А там где есть алгоритмы анализа - создание алгоритмов синтеза уже плёвое дело.
Количество пользователей, читающих эту тему: 0
0 пользователей, 0 гостей, 0 анонимных