Розробники з Google DeepMind навчили штучний інтелект (ШІ) визначати характеристики об'єктів у віртуальному світі - зокрема, їхню вагу та кількість. Щоб зрозуміти, чим відрізняються одні предмети від інших, комп'ютеру довелося вступити в безпосередню взаємодію з ними. Дослідники розповіли про результати своєї роботи у статті, опублікованій на сайті ArXiv.
Автори нової роботи створили систему штучного інтелекту на базі LSTM-нейромережі, яка навчилася визначати вагу і кількість об'єктів, що знаходяться перед нею. Ця нейромережа являє собою підвид рекурентних нейромереж, для яких характерна наявність зворотного зв'язку. Для її навчання дослідники створили два різних віртуальних світу, в яких комп'ютер міг взаємодіяти з оточуючими його предметами.
У першому світі перед ШІ знаходилося чотири однакових за розміром кубики, маса яких визначалася випадковим чином і змінювалася кожен раз, коли експеримент починався заново. ШІ міг рухати кубики по вертикалі, прикладаючи до них певну силу (розробники не забезпечували його віртуальним маніпулятором, він взаємодіяв з предметами "прямо"). Головне завдання комп'ютера полягала в тому, щоб навчитися знаходити найважчий кубик. Якщо він успішно справлявся із завданням, то отримував винагороду, якщо ні - штраф. Після багаторазового повторення експерименту ШІ "зрозумів", що для того, щоб правильно знайти найважчий кубик, необхідно попередньо підняти всі кубики, і тільки потім давати відповідь.
У другому віртуальному світі перед ШІ лежали п'ять кубиків, з яких була побудована башта. Частина кубиків стояли один на одному, створюючи єдиний блок, у той час як інші кубики лежали окремо. Штучний інтелект повинен був визначити, скільки перед ним знаходиться предметів, також взаємодіючи з ними і отримуючи в залежності від своєї відповіді позитивний або негативний зворотний зв'язок від навколишнього середовища. Згодом комп'ютер вибрав найкращу стратегію визначення правильної відповіді: він став руйнувати вежу і тільки потім оцінювати кількість всіх кубиків.
Дослідники не говорять про практичне застосування створеної ними системи, проте припускають, що в майбутньому вона може бути використана для роботів, яким, наприклад, буде необхідно переміщатися по нерівних поверхнях. Крім того, система може стати в нагоді роботам-помічникам, яким доведеться взаємодіяти з навколишнім світом - наприклад, кухонним роботам або роботам-космонавтам.
Раніше повідомлялося про те, що штучний інтелект зрівнявся в тесті IQ з чотирирічними дітьми. Автори використали тест WPPSI третього видання, який застосовується для дітей віком від 2,5 до 7 років. Щоб адаптувати видання для комп'ютерної програми, вчені використовували додаткові модулі, що переводять текстовий питання в набір ключових слів.