Фото: AP
Технология делает пока ошибки в одном слове из 7-8
Корпорация Microsoft работает над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса говорящего.
Об этом написал в корпоративном блоге директор
Microsoft по разработкам Рик Рашид.
Рашид впервые продемонстрировал работу
технологии, выступая на презентации в Китае. Сперва его речь на мероприятии
распознавалась в реальном времени и выводилась на экран в виде обновляемого
текста на английском языке.
Далее он показал, что новая программная
технология Microsoft позволяет переводить содержание этой речи на китайский
язык с учетом его лексических и грамматических особенностей - при этом перевод
шел также в реальном времени.
Наконец, финальным этапом стал голосовой
перевод его речи - Рашид произносил предложение на английском языке, а
программа воспроизводила его на китайском языке с сохранением особенностей
голоса топ-менеджера Microsoft.
"Наиболее значительным является то, что
мы добились важной цели - смогли позволить англоговорящему человеку, подобному
мне, провести презентацию на китайском, сохраняя свой голос", - отмечает в
блоге Рашид.
По словам Рашида, компания Microsoft ведет
разработки в этой области совместно с университетом Торонто около двух лет. В
то же время, несмотря на достигнутые успехи, технология по-прежнему делает
ошибки в одном слове из 7-8.
"Результаты по-прежнему не идеальны, и
предстоит серьезная работа в этой области, однако технология является весьма
многообещающей. Мы надеемся, что через несколько лет у нас будут системы,
которые смогут полностью разрушить языковые барьеры", подчеркнул он.
Когда технология распознавания и перевода речи
с сохранением голоса поступит в коммерческое использование, и поступит ли
вообще, топ-менеджер Microsoft не уточнил.