Підрозділ Google навчив комп'ютер краще говорити по-людськи

Лондонська компанія DeepMind, яку 3 придбав у 2014 році за 400 мільйонів фунтів стерлінгів, розробила нову технологію комп'ютерного генерування мовлення, результат якої більш близький до того, як люди говорять насправді.

Про це повідомляє Business Insider, додаючи, що нова програма отримала назву WaveNet. Її принцип відрізняється від звичайної користувачам системи ТТS, яка передбачає співставлення тексту із записами різних слів. Тепер комп'ютер вчиться повторювати реальні звуки, а не озвучувати слова.

В основі WaveNet лежить технологія нейронних мереж, суть якої полягає в повторення роботи людського мозку. Програма аналізує, живі звукові хвилі і аудіо сигнали, а потім намагається їх відтворити. Так у неї виходить мовлення, близьке до людського.

"Повторення реального мовлення завжди було великим викликом для сучасних комп'ютерних систем з величезною кількістю складних розгалужень модулів. Машина все одно не повторювала досконало людське природне мовлення. Наші дослідження показали, що лише технологія нейронних мереж може навчитися генерувати реальну людську мову. Однак скоротити розрив між людською і машинною манерою говорити все одно вдається лише на 50%", - пояснив вчений з DeepMind Аарон ван ден Ооорд.

В цей же час, розробники сумніваються, що Google почне використовувати їхній продукт найближчим часом, оскільки програма вимагає дуже значних ресурсів комп'ютера.

Нещодавно Google запатентував систему розпізнавання машин екстрених служб на дорозі. Технологія також дозволяє визначити напрямок руху поліцейського автомобіля і визначити, чи потребує ситуація відповідної реакції.

Підрозділ Google навчив комп'ютер краще говорити по-людськи – Business Insider

Принцип нової технології в тому, що штучний інтелект повторює звуки, а не співставляє записані слова з текстом.