В ходе исследования ученые провели 40 миллионов раундов компьютерной игры по собиранию фруктов между двумя "агентами" DeepMind, которые должны были соревноваться друг с другом и собрать настолько много виртуальных яблок, насколько это будет возможно.
Оказалось, что пока в игре было достаточное количество яблок искусственный интеллект вел себя мирно, но по мере того, как яблок становилось все меньше агенты были склонны использовать лазер для того, чтобы выбить оппонента из игры и собрать яблоки. При этом, никакой дополнительной "награды" за использование лазерного луча искусственный интеллект не получал. Он просто выбивал соперника из игры и получал возможность спокойно собирать яблоки.
Если же агенты не использовали лазерные лучи, они могли закончить игру с одинаковым количеством яблок. Интересно, что именно такую тактику избрали "менее интеллектуальные" версии DeepMind. Саботаж, агрессию и жадность демонстрировали только более комплексные версии искусственного интеллекта.
Более того, более комплексные формы DeepMind были склонны раньше начать использование лазера и таким образом получить доступ к львиной доле яблок. По мнению исследователей, это свидетельствует о том, что более интеллектуально развитые агенты больше склонны к обучению у окружающей среды и, как следствие, к более агрессивным тактикам поведения.
Исследователи также проверили возможности искусственного интеллекта в игре Wolfpack, в которой два агента DeepMind играли как волки, а один – как овца. Ученые подчеркивают, что из этой игры искусственный интеллект вынес мысль о том, что кооперация с другими может принести желаемый результат.
Ранее сообщалось о том, что искусственный интеллект сравнялся в тесте IQ с четырехлетними детьми. Авторы использовали тест WPPSI третьего издания, который применяется для детей в возрасте от 2,5 до 7 лет. Чтобы адаптировать издание для компьютерной программы, ученые использовали дополнительные модули, переводящие текстовый вопрос в набор ключевых слов.