UA / RU
Поддержать ZN.ua

DeepSeek представила новую модель искусственного интеллекта V4

Китайская компания заявила о снижении стоимости работы модели.

Китайская компания DeepSeek представила новую флагманскую серию моделей искусственного интеллекта V4 Flash и V4 Pro. Разработчики называют ее самой мощной платформой с открытым кодом и прямым конкурентом OpenAI и Anthropic. Стартап также заявил о значительном снижении стоимости работы модели после запуска новых вычислительных кластеров Huawei, из-за которых ранее откладывали выход моделей, передает Bloomberg.

DeepSeek развернула версии новой флагманской модели искусственного интеллекта V4 через год после громкого запуска модели R1, которая существенно повлияла на рынок ИИ. Компания представила V4 Flash и V4 Pro, заявив о высоких результатах в тестах программирования, рассуждений и агентских задач.

В компании отметили, что новая архитектура получила существенные обновления. В частности, речь идет о так называемой "гибридной архитектуре внимания", которая улучшает способность модели запоминать контекст во время длинных диалогов.

Читайте также: Глобальный бойкот DeepSeek: почему мир массово блокирует китайский ИИ

Благодаря этому контекстное окно V4 увеличили до 1 миллиона токенов. Это позволяет загружать целые кодовые базы или большие документы в одном запросе без потери качества обработки.

Новая система использует архитектуру Mix-of-Experts с триллионом параметров. При этом для конкретной задачи активируется только до 37 миллиардов параметров, что существенно снижает затраты на вычисления по сравнению с аналогичными моделями.

DeepSeek заявляет, что V4 Pro в настоящее время имеет очень ограниченные вычислительные ресурсы из-за дефицита мощностей. Однако после запуска новых кластеров на базе чипов Huawei Ascend 950 во второй половине 2026 года компания ожидает значительного снижения цен.

Читайте также: DeepSeek не предоставила американским производителям чипов доступа к новой модели ИИ

DeepSeek также ведет переговоры с Tencent Holdings и Alibaba Group относительно первого раунда финансирования. Это может стать важным шагом для масштабирования бизнеса на фоне конкуренции с американскими технологическими компаниями.

Компания подчеркивает, что ее модель конкурирует с последними разработками OpenAI, Google и Anthropic не только по производительности, но и по стоимости использования. V4 ориентирована на развертывание на более дешевой инфраструктуре, что делает ее привлекательной для бизнеса.

"В конце концов, разрыв в производительности модели будет незаметным для большинства пользователей", — заявил директор Union Bancaire Privée Вей-Серн Линг.

Вместе с популярностью DeepSeek выросло и внимание со стороны США. Американские чиновники и технологические компании подозревают компанию в использовании запрещенных чипов Nvidia Blackwell, а также в возможном применении дистилляции — обучения на результатах моделей OpenAI и Anthropic.