Софтверная корпорация Microsoft работает над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса говорящего, написал в корпоративном блоге директор Microsoft по разработкам Рик Рашид.
Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сперва его речь на мероприятии распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.
Далее он показал, что новая программная технология Microsoft позволяет переводить содержание этой речи на китайский язык с учетом его лексических и грамматических особенностей - при этом перевод шел также в реальном времени.
Наконец, финальным этапом стал голосовой перевод его речи - Рашид произносил предложение на английском языке, а программа воспроизводила его на китайском языке с сохранением особенностей голоса топ-менеджера Microsoft.
«Наиболее значительным является то, что мы добились важной цели - смогли позволить англоговорящему человеку, подобному мне, провести презентацию на китайском, сохраняя свой голос», - отмечает в блоге Рашид.
Подобная технология может быть востребована среди туристов, однако не найдет применения в сфере бизнес-переговоров, где важны интонация и другие нюансы речи.
По словам Рашида, компания Microsoft ведет разработки в этой области совместно с университетом Торонто около двух лет. В то же время, несмотря на достигнутые успехи, технология по-прежнему делает ошибки в одном слове из 7-8.
«Результаты по-прежнему не идеальны, и предстоит серьезная работа в этой области, однако технология является весьма многообещающей. Мы надеемся, что через несколько лет у нас будут системы, которые смогут полностью разрушить языковые барьеры», - заявил Рашид.
Когда технология распознавания и перевода речи с сохранением голоса поступит в коммерческое использование, и поступит ли вообще, топ-менеджер Microsoft не уточнил.
Напомним, что над своими технологиями распознавания голоса и способами их применения также работают компании Apple (система голосового управления Siri), Samsung (голосовой помощник S Voice), Google и другие. В частности, сервис Google Translate позволяет ввести нужное слово или выражение при помощи голоса и прослушать перевод на нужном языке. !zn
Читайте также:
Microsoft выпускает версию Office для iPhone и Android
Microsoft тестирует смартфон под собственным брендом
Европейская комиссия обвинила Microsoft в несоблюдении соглашений