Версия для слабовидящих
Специалисты Fujitsu наделили синтезированную речь реалистичным звучанием Печать Email
Новости об инновациях
09.04.2014

Синтезированная речь прошла долгий путь. Ещё не так давно компьютеры разговаривали металлическими скрипучими голосами. Однако даже сейчас искусственный голос может совершенствоваться. Специалисты японской компании Fujitsu Laboratories работают над тем, чтобы компьютеры перестали звучать монотонно. Они учат технику генерировать интонации в зависимости от среды и обстоятельств.

Синтезированная речь − одна из тех технологий, которые обыватели склонны считать футуристическими. Но она используется в повседневной жизни чаще, чем можно себе представить, и заключается не только в беседе смартфона с пользователем.

Эта распространённая технология зачитывает текст людям с ослабленным зрением, сообщает срочную информацию, если простого сигнала тревоги недостаточно, произносит объявления в аэропортах и на вокзалах, позволяет взаимодействовать со спутниковой навигационной системой.

o_925864.jpg Рис. 1. Сценарии использования синтезированной речи (иллюстрация Fujitsu Laboratories).

Проблема в том, что синтезированная речь всегда представляет собой компромисс. Она может работать либо хорошо, либо быстро. Но какой бы метод синтеза не использовался для преобразования кода в голос, в идеале речь должна звучать естественно и разборчиво. То есть звук должен быть таким, словно он исходит от человека, а не от машины, и к тому же он должен быть понятен слушателям.

Впрочем, даже если нюансы будут соблюдены, результат может звучать слишком монотонно или же искажать смысл слов (так как во многих языках смысл сказанного во многом зависит от интонации). Также синтезированный голос может быть понятным, но ему может не хватать уверенности или он не будет звучать так, чтобы необходимые меры (в случае опасности) были приняты срочно. Может быть и так, что программист вложит в голос какую-то абсолютно неуместную интонацию: вряд ли кто-то хочет, чтобы радостный голос сообщил ему, что банковский счёт заблокирован.

Правильная программа может производить речь, которая будет ясно слышима в шумной обстановке, на больших расстояниях и открытых площадках и, конечно, привлечёт внимание слушателя. Для достижения этого необходимо не просто задать регулируемые параметры, но и научить машины генерировать реалистичные голоса без использования объёмных баз данных предварительно записанной речи или трудоёмких алгоритмов.

o_925866.jpg Рис. 2. Система синтеза речи может производить различные интонации в зависимости от ситуации (иллюстрация Fujitsu Laboratories).

Вместо того чтобы использовать множество данных и манипулировать синтезированной речью, изменяя лишь скорость, высоту тона и громкость, специалисты Fujitsu разработали более гибкий подход. Они манипулируют такими компонентами, как интонации и паузы, а их алгоритм помогает воспроизводить речь в десятки раз быстрее предыдущих методов.

Это немного похоже на разницу между китайскими иероглифами и латинским алфавитом. Системы (прежние и новая) могут передать смысл сказанного, но латинский алфавит куда более гибок и требует использования гораздо менее сложной клавиатуры.

Для синтеза речи по методу Fujitsu используется меньшая база данных звуков речи, но обрабатывается она с помощью специального алгоритма, способного генерировать интонации в зависимости от ситуации.

Это значит, что система Fujitsu может адаптировать синтезированную речь к конкретным условиям. Сигнал тревоги должен звучать безотлагательно и достаточно громко, чтобы его можно было услышать на аэродроме или в шумном заводском цеху. Голос может звучать обнадёживающе, в соответствии с тем образом, который компания хочет представить общественности. Представители компании Fujitsu утверждают, что технология может быть адаптирована и для портативных устройств, например, для тех, что используются в медицине, а также для воссоздания речи человека, утратившего способность говорить вследствие хирургической операции или несчастного случая.

Компания надеется, что практическое применение системы начнётся уже в течение 2014 года.

Источник - http://www.nanonewsnet.ru/news/2014/spetsialisty-fujitsu-nadelili-sintezirovannuyu-rech-realistichnym-zvuchaniem

 

Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта Карта сайта