Блокує навіть аналіз коду: Anthropic критикують через обмеження ШІ Fable

Поділитися
Блокує навіть аналіз коду: Anthropic критикують через обмеження ШІ Fable © Getty Images
Експерти з кібербезпеки скаржаться, що система блокує будь-які запити, в яких є лексика кібербезпеки.

Нова модель штучного інтелекту Fable від компанії Anthropic, призначена для безпечної роботи у сфері кібербезпеки, викликала невдоволення серед дослідників галузі. Фахівці стверджують, що встановлені компанією обмеження спрацьовують занадто часто та блокують навіть нешкідливі запити, передає TechCrunch.

“(Fable) відхиляє будь-які запити, які хоч якось пов’язані з кібербезпекою. Навіть такі нешкідливі завдання, як читання допису в блозі”, — написала в соцмережі X дослідниця в галузі безпеки, яка працює в IBM X-Force, Валентина “Чомпі” Пальміотті.

Якщо система вважає запит потенційно ризикованим, чат автоматично призупиняється. У такому випадку користувач отримує повідомлення про те, що механізми безпеки виявили теми, пов’язані з кібербезпекою або біологією.

Обмеження запровадили для зниження ризику використання моделі у розробці шкідливого програмного забезпечення чи компрометації систем. Деякі біологічні теми блокуються через побоювання щодо можливого використання ШІ для створення біологічної зброї. Водночас один із фахівців у сфері кібербезпеки написав у соцмережі X, що обмеження Fable спрацьовують навіть під час запиту на звичайний огляд програмного коду.

Ветеран галузі кібербезпеки Метт Суїче підтвердив, що прохання написати безпечний код також може бути помилково класифіковане як діяльність у сфері кібербезпеки, через що користувача автоматично переводять на модель Claude Opus 4.8. За словами Суїче, система, ймовірно, значною мірою орієнтується на ключові слова, через що обмеження можуть спрацьовувати на будь-які терміни, пов’язані з лексикою кібербезпеки.

“Але це зрозуміло, оскільки ми все ще перебуваємо на початковому етапі, і вони все ще адаптують свої захисні механізми. Я впевнений, що з часом вони будуть розвиватися, оскільки Anthropic та інші передові компанії-розробники моделей будуть більш тісно співпрацювати з нинішнім новим поколінням компаній з кібербезпеки”, — додав експерт, який нині працює в стартапі з кібербезпеки ШІ Tolmo.

Спеціалізована модель кібербезпеки Mythos, на базі якої створено Fable, Anthropic представила у квітні в межах програми Project Glasswing. Спочатку для захисту критично важливого програмного забезпечення й інфраструктури доступ до неї отримала обмежена кількість компаній та організацій. Як пише TechCrunch, минулого тижня компанія розширила програму на сотні організацій у 15 країнах.

Поділитися
Помітили помилку?

Будь ласка, виділіть її мишкою та натисніть Ctrl+Enter або Надіслати помилку

Додати коментар
Всього коментарів: 0
Текст містить неприпустимі символи
Залишилось символів: 2000
Будь ласка, виберіть один або кілька пунктів (до 3 шт.), які на Вашу думку визначає цей коментар.
Будь ласка, виберіть один або більше пунктів
Нецензурна лексика, лайка Флуд Порушення дійсного законодвства України Образа учасників дискусії Реклама Розпалювання ворожнечі Ознаки троллінгу й провокації Інша причина Відміна Надіслати скаргу ОК
Залишайтесь в курсі останніх подій!
Підписуйтесь на наш канал у Telegram
Стежити у Телеграмі