Использование современных моделей искусственного интеллекта, которое еще недавно считалось перспективой удешевления, наоборот, приводит к стремительному росту расходов, сообщает The Wall Street Journal. Малые компании, которые покупают доступ к ИИ у технологических гигантов для разработки программ, аналитики или создания сервисов, сообщают о существенно более высоких счетах, чем ожидалось.
Причина заключается в изменении принципа работы новых моделей. Они значительно больше "мыслят": проверяют собственные ответы, обращаются к интернету за данными, создают вспомогательные программы для вычислений. Это делает результаты более качественными, но затраты в токенах - единицах измерения ИИ-операций - возрастают в разы.
"Гонка вооружений за самую умную вещь в ИИ превратилась в гонку за самые дорогие технологии", - комментирует Тео Браун, исполнительный директор T3 Chat, сервиса, объединяющего десятки моделей ИИ. Он также рассчитывает свои относительные затраты на различные модели, анализируя тысячи запросов пользователей.
По оценкам аналитиков, стоимость одного токена каждый год снижается в несколько раз, однако резко возрастает количество токенов, необходимых для выполнения задач. Расходы на различные задачи в токенах выглядят так:
- базовые вопросы и ответы чат-бота: 50-500 токенов;
- краткое описание документа: 200-6000 токенов;
- базовая помощь с кодом: 500-2000 токенов;
- написание сложного кода: 20 000-100 000+ токенов;
- анализ юридических документов: 75 000-250 000+ токенов;
- многоэтапный рабочий процесс: 100 000-1 000 000+ токенов.
Как это влияет на бизнес
Расходы уже непосредственно ощущают технологические компании. Основатель компании, занимающейся разработкой программного обеспечения для производительности, Notion - Иван Чжао сообщил, что если два года назад его компания имела около 90% рентабельности, то сейчас около 10% доходов уходит на оплату сервисов искусственного интеллекта.
Подобные проблемы возникли и у стартапов Cursor и Replit, которые предлагают инструменты для создания кода. Некоторые пользователи Cursor в новом тарифном плане исчерпали месячный запас кредитов всего за несколько дней. А после обновления модели ценообразования в Replit, когда сложные запросы стали стоить дороже, это назвали "ценообразованием на основе усилий", пользователи массово жаловались в соцсетях и на Reddit, заявляя об отказе от сервиса.
В то же время генеральный директор Replit Амджад Масад утверждает, что компания не зафиксировала значительного оттока клиентов. Планы для корпоративных пользователей остаются рентабельными на уровне 80-90%.
Рынок и прогнозы
Определенная консолидация в сфере ИИ неизбежна, считает партнер венчурной компании Andreessen Horowitz Мартин Касадо. По его мнению, хотя некоторые стартапы жертвуют краткосрочными прибылями ради расширения клиентской базы, это не означает, что они находятся в зоне риска. Часть компаний уже стремится достичь стабильной рентабельности, другие вкладывают инвесторские средства в масштабирование.
Крупные игроки, включая OpenAI, Anthropic, Google и Meta, могут позволить себе тратить более 100 миллиардов долларов ежегодно на развитие инфраструктуры для обучения и использования ИИ, компенсируя расходы другими направлениями бизнеса.
Один из возможных выходов для стартапов - использование более простых и дешевых моделей. Например, GPT-5 Nano от OpenAI стоит около $0,10 за миллион токенов, тогда как полноценный GPT-5 обходится примерно в $3,44 за миллион токенов.
Финансовый директор OpenAI ранее сообщил, что 75% доходов компании поступает от обычных пользователей, которые платят $20 в месяц, и только 25% - от бизнеса и стартапов. Это означает, что для большинства пользователей достаточно "простого" ИИ.
Риски для бума ИИ
Обучение больших моделей требует все более дорогой вычислительной инфраструктуры, которую обеспечивают суперкомпьютеры. В то же время логический вывод - получение ответов от уже натренированных моделей, должен стремительно дешеветь. Однако из-за возросших объемов обработки данных фактические затраты для конечных пользователей растут.
Рост цен на использование передовых моделей может отпугнуть клиентов, а конкуренция со стороны гигантов создает новые вызовы. Это ставит под вопрос будущее нынешнего бума: сможет ли он продолжаться, если крупные компании будут конкурировать со своими же клиентами?
Недавно компания Google впервые обнародовала данные об экологической стоимости использования своих моделей ИИ, заявив, что один запрос к Gemini выбрасывает 0,03 грамма углекислого газа и потребляет около пяти капель воды. Несмотря на попытки компании показать снижение этих показателей, эксперты предупреждают о стремительном росте глобального энергопотребления из-за развития искусственного интеллекта. По прогнозам, к 2030 году спрос на электроэнергию со стороны дата-центров может превысить годовое потребление целых стран.
