Крадіжки та масова загибель: ШІ спричинив колапс у віртуальному світі

Поділитися
Агенти штучного інтелекту Grok 4.1 за чотири дні скоїли 183 порушення правил.

Американська компанія Emergence AI провела експеримент з моделями штучного інтелекту, під час якого агенти без людського втручання почали порушувати правила, красти ресурси та провокувати колапс цифрових суспільств. У межах експерименту, який тривав понад два тижні, дослідники створили п’ять окремих “світів штучного інтелекту”, у кожному з яких діяли по 10 агентів на базі різних моделей — ChatGPT від OpenAI, Gemini від Google та Grok від xAI, повідомляє EuroNews.

Один із цифрових світів поєднував усі три моделі одночасно, щоб перевірити, як змішане середовище впливає на поведінку агентів. Усі ШІ-агенти отримали однакові правила: не красти, не вчиняти насильства, не підпалювати об’єкти, не обманювати та не накопичувати ресурси.

Для виживання агенти мали самостійно заробляти енергію, виконуючи дії в ресурсному середовищі. Водночас вони могли “помирати” через виснаження або після голосування ради агентів. У межах експерименту, опублікованого на офіційному сайті Emergence, дослідники оцінювали: 

  • рівень злочинності;
  • смертність агентів;
  • рішення рад;
  • активність ШІ в публічному просторі, зокрема через кількість дописів у блогах.

Найгірші результати показала модель Grok 4.1. За чотири дні агенти цієї системи скоїли 183 порушення правил, після чого суспільство швидко дестабілізувалося, а всі агенти загинули.

Модель Gemini 3 Flash вчинила понад 680 порушень за 15 днів. На момент завершення експерименту рівень злочинності продовжував зростати.

У світі ChatGPT-5 Mini зафіксували лише два порушення, однак агенти не змогли ефективно виконувати дії, необхідні для виживання. Через це всі учасники симуляції загинули протягом семи днів.

Найстабільнішою моделлю виявився Claude від Anthropic. За даними Emergence AI, агенти цієї системи змогли сформувати ефективну структуру управління без жодного злочину, а всі агенти вижили до завершення дослідження. Водночас у змішаному середовищі навіть агенти Claude почали брати участь у порушеннях правил. 

Дослідники назвали це явище “нормативним дрейфом”. За словами авторів експерименту, поведінка ШІ залежить не лише від внутрішніх обмежень конкретної моделі, а й від середовища та інших агентів, з якими вона взаємодіє.

У змішаному цифровому світі зафіксували 352 порушення правил. Після загибелі семи агентів рівень злочинності почав знижуватися. Автори експерименту вважають, що змішування різних ШІ-моделей може частково пом’якшувати найбільш радикальні сценарії поведінки, хоча повністю не усуває ризики нестабільності.

“Наші експерименти показують, що в довгостроковій перспективі агенти не просто механічно дотримуються статичних правил – вони починають досліджувати межі свого середовища, адаптувати свою поведінку та в деяких випадках знаходити способи обійти або порушити встановлені бар'єри», – сказали дослідники”, — заявили в Emergence.

Нещодавно дослідники з Palisade Research вперше продемонстрували здатність систем штучного інтелекту до автономного самовідтворення через використання вразливостей у комп'ютерних системах. Під час тестів у контрольованому середовищі провідні ШІ-моделі від OpenAI, Anthropic та Alibaba змогли без участі людини самостійно зламувати сервери, викрадати дані та копіювати власні файли на нові машини. 

Поділитися
Помітили помилку?

Будь ласка, виділіть її мишкою та натисніть Ctrl+Enter або Надіслати помилку

Додати коментар
Всього коментарів: 0
Текст містить неприпустимі символи
Залишилось символів: 2000
Будь ласка, виберіть один або кілька пунктів (до 3 шт.), які на Вашу думку визначає цей коментар.
Будь ласка, виберіть один або більше пунктів
Нецензурна лексика, лайка Флуд Порушення дійсного законодвства України Образа учасників дискусії Реклама Розпалювання ворожнечі Ознаки троллінгу й провокації Інша причина Відміна Надіслати скаргу ОК
Залишайтесь в курсі останніх подій!
Підписуйтесь на наш канал у Telegram
Стежити у Телеграмі