Microsoft представила технологию перевода речи с сохранением особенностей голоса
Корпорация Microsoft работает над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса говорящего.
Об этом написал в корпоративном блоге директор Microsoft по разработкам Рик Рашид.
Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сперва его речь на мероприятии распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.
Далее он показал, что новая программная технология Microsoft позволяет переводить содержание этой речи на китайский язык с учетом его лексических и грамматических особенностей - при этом перевод шел также в реальном времени.
Наконец, финальным этапом стал голосовой перевод его речи - Рашид произносил предложение на английском языке, а программа воспроизводила его на китайском языке с сохранением особенностей голоса топ-менеджера Microsoft.
"Наиболее значительным является то, что мы добились важной цели - смогли позволить англоговорящему человеку, подобному мне, провести презентацию на китайском, сохраняя свой голос", - отмечает в блоге Рашид.
По словам Рашида, компания Microsoft ведет разработки в этой области совместно с университетом Торонто около двух лет. В то же время, несмотря на достигнутые успехи, технология по-прежнему делает ошибки в одном слове из 7-8.
"Результаты по-прежнему не идеальны, и предстоит серьезная работа в этой области, однако технология является весьма многообещающей. Мы надеемся, что через несколько лет у нас будут системы, которые смогут полностью разрушить языковые барьеры", подчеркнул он.
Когда технология распознавания и перевода речи с сохранением голоса поступит в коммерческое использование, и поступит ли вообще, топ-менеджер Microsoft не уточнил.