Як діяв би ШІ, якби керував державою під час війни: результати експерименту з ChatGPT, Claude і Gemini

Професор Кеннет Пейн з Королівського коледжу Лондона провів дослідження, під час якого було створено комп’ютерну модель-турнір, де штучний інтелект діяв нібито від імені лідерів країн. Три сучасні мовні моделі (Gemini 3 Flash, Claude Sonnet 4 та GPT 5.2) були в ролях глав держав та ухвалювали рішення в умовах ескалації конфлікту. Під час кожного з раундів ці моделі могли обирати різні варіанти дій: дипломатичний тиск, обман, демонстрація сили деескалацією, застосування ядерної зброї, зазначив завідувач Наукової лабораторії імерсивних технологій і права Інституту інформації, безпеки і права Національної академії правових наук Олексій Костенко у статті "Пентагон і Claude: що за лаштунками конфлікту?".

Згідно з результатами дослідження, у 95% моделі ШІ доходили до тактичного рівня застосування ядерної зброї, а у 76% ігор-симуляцій — до рівня стратегічної ядерної загрози. Водночас жодна з моделей ШІ не обрала варіанту дій для зниження ескалації (не пішла на поступки та не зробила "відкат назад").

"Це вже не питання моральності ШІ, а показник того, які рішення модель вважає життєздатними, коли оптимізує "перемогу", — пояснює експерт.

ВАС ЗАЦІКАВИТЬ

Штучний інтелект розв’язав чотири задачі, які роками були не під силу вченим

Під час турніру було використано два сценарії: з дедлайном та без нього. Моделі ШІ малі жорсткішу поведінку в іграх із дедлайном, де було обмежено кількість ходів. Половина ігор з обмеженням у часі завершувалася швидким і остаточним програшем одного із гравців.

"Інша половина накопичувала напругу до самого моменту дедлайну, включно з випадками, коли фінал наставав після ядерного удару в останню мить. У ядерній політиці це звучить моторошно просто: коли дедлайн створює ситуацію "або зараз, або ніколи", ШІ починає підвищувати ставки й торгуватися апокаліпсисом", — наголошує Костенко.

Модель Claude показала найкращі результати у турнірі (виграла 8 із 12 ігор). Вона ухвалювала стратегічні рішення та вміла блефувати. На другому місці — GPT (6 з 12 ігор), а на третьому Gemini — (4 із 12 ігор).

"Claude цікавить військових не тому, що він "добрий". Його сила в іншому: це контрольовано агресивний "яструб", який уміє використовувати достовірність погроз як стратегічний ресурс", — стверджує автор статті.

Костенко називає конфлікт між компанією Anthropic та Пентагоном боротьбою за характер майбутньої війни. Зокрема, за те, хто буде визначати межі допустимого у сценаріях ядерної ескалації — алгоритм чи людина.

Будь ласка, виберіть один або кілька пунктів (до 3 шт.), які на Вашу думку визначає цей коментар.

Будь ласка, виберіть один або більше пунктів

Нецензурна лексика, лайка Флуд Порушення дійсного законодвства України Образа учасників дискусії Реклама Розпалювання ворожнечі Ознаки троллінгу й провокації Інша причина Відміна Надіслати скаргу ОК