Работа двух месяцев за один день: Anthropic выпустила безопасную версию своего опаснейшего ИИ Mythos

Компания Anthropic объявила о запуске двух новых моделей искусственного интеллекта — Claude Fable 5 и Claude Mythos 5. Согласно заявлению разработчиков, они превосходят все предыдущие модели Claude по производительности в программировании, научных исследованиях, работе с данными и компьютерном зрении.

Claude Fable 5 компания называет первой общедоступной системой класса Mythos. По словам разработчиков, новинка демонстрирует лучшие результаты почти на всех внутренних и внешних тестах возможностей искусственного интеллекта, особенно в сложных и длительных задачах. В то же время из-за повышенных рисков злоупотреблений компания внедрила новые механизмы безопасности, которые ограничивают использование мощных возможностей моделей в чувствительных сферах.

Одновременно компания запустила Claude Mythos 5 — версию той же базовой модели со снятыми частью ограничений безопасности. Сейчас она доступна только ограниченному кругу партнеров в рамках программы Project Glasswing, которая реализуется в сотрудничестве с правительством США.

ВАС ЗАИНТЕРЕСУЕТ

ИИ может упростить создание биологического оружия: руководители OpenAI, Google и Anthropic бьют тревогу

Результаты тестирований Claude Fable 5

В Anthropic отмечают, что новые модели имеют значительно более широкие возможности автономной работы. В частности, во время тестирования платежная компания Stripe сообщила, что Fable 5 выполнила масштабную миграцию 50-миллионной кодовой базы Ruby за один день, тогда как команде инженеров на такую работу понадобилось бы более двух месяцев.

Модель также продемонстрировала высокие результаты в аналитических задачах. На финансовом бенчмарке Hebbia's она получила лучший результат среди всех протестированных моделей, показав сильные навыки работы с документами, таблицами, диаграммами и сложными расчетами.

Отдельно в компании отмечают прогресс в сфере компьютерного зрения. Claude Fable 5 способна анализировать сложные научные изображения, извлекать из них точные данные и даже воспроизводить исходный код веб-приложений только на основе скриншотов интерфейса. Во время одного из тестов модель самостоятельно прошла игру Pokémon FireRed, используя только визуальную информацию без дополнительных инструментов навигации.

ВАС ЗАИНТЕРЕСУЕТ

Риск самосовершенствования систем: Anthropic предлагает ввести международный контроль над ИИ

Разработчики также заявляют о существенных улучшениях памяти и работы с длинным контекстом. Fable 5 может эффективно работать с миллионами токенов и использовать собственные заметки для повышения результативности во время длительных задач. В игре Slay the Spire подключение постоянной файловой памяти втрое улучшило производительность модели по сравнению с Opus 4.8, а финала она достигала втрое чаще.

Anthropic также отмечает, что Fable 5 эффективнее предыдущих моделей Claude использует токены. В оценке Cognition FrontierCode, которая проверяет могут ли модели выполнять сложные задачи по кодированию, соответствуя стандартам высококачественных производственных кодовых баз, Claude Fable 5 получила самый высокий балл среди конкурентов, продемонстрировав этот результат даже при среднем уровне усилий.

Результаты тестирования Claude Mythos 5

Claude Mythos 5 продемонстрировала наиболее заметные результаты в биологических исследованиях. По данным Anthropic, внутренние специалисты по проектированию белков смогли ускорить отдельные этапы разработки лекарств примерно в десять раз. В ряде тестов модель самостоятельно выполняла задачи, которые обычно выполняют исследователи, включая выбор мест связывания белков, запуск инструментов биоинформатики и исправление ошибок в процессе работы.

ВАС ЗАИНТЕРЕСУЕТ

Нобелевская премия для ИИ и "ненулевой шанс убить всех": прогноз сооснователя Anthropic

Кроме того, компания утверждает, что Mythos 5 стала первой моделью Anthropic, которая стабильно генерирует новые научные гипотезы. Во время слепых сравнений ученые отдавали предпочтение ее предложениям в области молекулярной биологии примерно в 80% случаев.

Высокие результаты Mythos 5 демонстрирует и во время геномных исследований. За неделю преимущественно автономной работы Mythos 5 проанализировал миллионы клеток 138 видов животных и научил собственную ИИ-модель идентифицировать клетки с похожими функциями в различных организмах. Действуя по общим указаниям человека, модель превзошла недавно опубликованный в журнале Science аналог.

Новые меры безопасности Anthropic

Из-за потенциальных рисков компания внедрила новую систему защиты. Если пользователь отправляет запрос, связанный с кибербезопасностью, биологией, химией или попытками дистилляции моделей, специальные классификаторы автоматически передают его для обработки менее мощной модели Claude Opus 4.8. По данным Anthropic, такие механизмы срабатывают менее чем в 5% сеансов.

ВАС ЗАИНТЕРЕСУЕТ

Сооснователь Anthropic предупредил об угрозе массовой потери рабочих мест из-за ИИ

В компании объясняют, что модели класса Mythos уже достигли уровня, при котором их возможности могут быть использованы для проведения сложных кибератак или ускорения опасных исследований двойного назначения. Именно поэтому защитные механизмы настроили максимально консервативно.

Также Anthropic вводит новую политику хранения данных. Для моделей уровня Fable 5 и Mythos 5 вводится обязательное 30-дневное хранение трафика на всех платформах для защиты от сложных кибератак и уменьшения ложных срабатываний. Эти данные не будут использоваться для обучения Claude, а доступ к ним будет регистрироваться с гарантированным удалением по истечении месячного срока.

Доступность Claude Fable 5

Claude Fable 5 уже доступна через API и для пользователей планов Pro, Max, Team и Enterprise. До 22 июня модель можно использовать без дополнительной платы в рамках подписки. После этого доступ к ней временно переведут на систему кредитов использования, пока компания не увеличит вычислительные мощности.

Стоимость обеих моделей составляет 10 долларов за миллион входных токенов и 50 долларов за миллион выходных токенов. По словам Anthropic, это менее половины цены Claude Mythos Preview.

Недавно Anthropic привлекла 65 миллиардов долларов в новом раунде финансирования, благодаря чему ее рыночная оценка достигла 900 миллиардов долларов. Это позволило стартапу опередить конкурента OpenAI с его показателем в 730 миллиардов долларов и стать самой дорогой ИИ-компанией в мире.

Пожалуйста выберите один или несколько пунктов (до 3 шт.) которые по Вашему мнению определяет этот комментарий.

Пожалуйста выберите один или больше пунктов

Нецензурная лексика, ругань Флуд Нарушение действующего законодательства Украины Оскорбление участников дискуссии Реклама Разжигание розни Признаки троллинга и провокации Другая причина Отмена Отправить жалобу ОК