UA / RU
Підтримати ZN.ua

DeepSeek представила нову модель штучного інтелекту V4

Китайська компанія заявила про зниження вартості роботи моделі.

Китайська компанія DeepSeek представила нову флагманську серію моделей штучного інтелекту V4 Flash та V4 Pro. Розробники називають її найпотужнішою платформою з відкритим кодом і прямим конкурентом OpenAI та Anthropic. Стартап також заявив про значне зниження вартості роботи моделі після запуску нових обчислювальних кластерів Huawei, через які раніше відкладали вихід моделей, передає Bloomberg.

DeepSeek розгорнула версії нової флагманської моделі штучного інтелекту V4 через рік після гучного запуску моделі R1, яка суттєво вплинула на ринок ШІ. Компанія представила V4 Flash та V4 Pro, заявивши про високі результати в тестах програмування, міркувань та агентних завдань.

У компанії наголосили, що нова архітектура отримала суттєві оновлення. Зокрема, йдеться про так звану “гібридну архітектуру уваги”, яка покращує здатність моделі запам’ятовувати контекст під час довгих діалогів.

Читайте також: Глобальний бойкот DeepSeek: чому світ масово блокує китайський ШІ

Завдяки цьому контекстне вікно V4 збільшили до 1 мільйона токенів. Це дозволяє завантажувати цілі кодові бази або великі документи в одному запиті без втрати якості обробки.

Нова система використовує архітектуру Mix-of-Experts із трильйоном параметрів. При цьому для конкретного завдання активується лише до 37 мільярдів параметрів, що суттєво знижує витрати на обчислення порівняно з аналогічними моделями.

DeepSeek заявляє, що V4 Pro наразі має дуже обмежені обчислювальні ресурси через дефіцит потужностей. Однак після запуску нових кластерів на базі чипів Huawei Ascend 950 у другій половині 2026 року компанія очікує значного зниження цін.

Читайте також: DeepSeek не надала американським виробникам чипів доступу до нової моделі ШІ

DeepSeek також веде переговори з Tencent Holdings та Alibaba Group щодо першого раунду фінансування. Це може стати важливим кроком для масштабування бізнесу на тлі конкуренції з американськими технологічними компаніями.

Компанія підкреслює, що її модель конкурує з останніми розробками OpenAI, Google та Anthropic не лише за продуктивністю, а й за вартістю використання. V4 орієнтована на розгортання на дешевшій інфраструктурі, що робить її привабливою для бізнесу.

“Зрештою, розрив у продуктивності моделі буде непомітним для більшості користувачів”, — заявив директор Union Bancaire Privée Вей-Серн Лінг.

Разом із популярністю DeepSeek зросла й увага з боку США. Американські урядовці та технологічні компанії підозрюють компанію у використанні заборонених чипів Nvidia Blackwell, а також у можливому застосуванні дистиляції — навчання на результатах моделей OpenAI та Anthropic.