Об этом сообщает Business Insider, добавляя, что новая программа получила название WaveNet. Ее принцип отличается от привычной для пользователей системы ТТЅ, которая предусматривает сопоставление текста с записями различных слов. Теперь компьютер учится повторять реальные звуки, а не озвучивать слова.
В основе WaveNet лежит технология нейронных сетей, суть которой заключается в повторении работы человеческого мозга. Программа анализирует, живые звуковые волны и аудио сигналы, а потом пытается их воспроизвести. Так у нее получается речь, близкая к человеческой.
"Повторение реального разговора всегда было большим вызовом для современных компьютерных систем с огромным количеством сложных разветвлений модулей. Машина все равно не повторяла в совершенстве то, как естественно люди говорят. Наши исследования показали, что только технология нейронных сетей может научиться генерировать реальную человеческую речь. Однако сократить разрыв между человеческой и машинной манерой говорить все равно удается лишь на 50%", - пояснил ученый с DeepMind Аарон ван ден Ооорд.
В это же время, разработчики сомневаются, что Google начнет использовать их продукт в ближайшее время, поскольку программа требует очень значительных ресурсов компьютера.
Недавно Google запатентовал систему распознавания машин экстренных служб на дороге. Технология также позволяет определить направление движения полицейского автомобиля и требует ли ситуация ответной реакции.