Google объявила о запуске Gemini 3 Flash — новой модели искусственного интеллекта с оптимизированной скоростью. Она сочетает возможности рассуждения уровня Gemini 3 с более низкой задержкой и значительно меньшей стоимостью. Модель уже доступна разработчикам, предприятиям и миллионам пользователей в приложении и поиске Google.
В прошлом месяце Google запустила Gemini 3 Pro и Gemini 3 Deep Think, после чего ежедневный объем обработки через API, по сообщению компании, превысил 1 трлн токенов. Разработчики отмечают, что пользователи активно применяют Gemini 3 для моделирования кода, изучения сложных тем, создания игр и работы с мультимодальным контентом.
Gemini 3 Flash сохраняет ключевые возможности Gemini 3, в частности, сложные рассуждения, визуальное и мультимодальное понимание, а также агентное кодирование. В то же время модель оптимизирована по скорости, эффективности и стоимости, что делает ее удобной в частых повседневных задачах.

По данным Google, Gemini 3 Flash демонстрирует высокие результаты в сложных тестах на рассуждения и знания. В частности, модель получила 90,4% в GPQA Diamond и 81,2% в MMMU Pro, показав производительность, сравнимую с Gemini 3 Pro.
Модель также оптимизировали с точки зрения эффективности использования ресурсов. В типичном трафике Gemini 3 Flash использует в среднем на 30% меньше токенов, чем Gemini 2.5 Pro, сохраняя высокое качество ответов.
Google отмечает, что Gemini 3 Flash в три раза быстрее Gemini 2.5 Pro и стоит значительно дешевле. Стоимость модели составляет $0,50 за 1 млн входных токенов и $3 за 1 млн выходных токенов.
Gemini 3 Flash ориентирован на итеративную разработку и агентное кодирование. В тесте SWE-bench Verified модель достигла результата 78%, превзойдя как серию 2.5, так и Gemini 3 Pro.
Gemini 3 Flash стал моделью по умолчанию в приложении Gemini, заменив версию 2.5 Flash. Это означает, что пользователи во всем мире получают бесплатный доступ к возможностям Gemini 3.

Кроме того, Gemini 3 Flash начинает разворачиваться как стандартная модель для режима искусственного интеллекта в поиске Google. В этом режиме модель анализирует сложные запросы, сочетая исследования, локальную информацию в реальном времени и практические рекомендации.
В то же время Google существенно ограничила возможности для пользователей, которые используют Gemini 3 Pro и генератор изображений Nano Banana Pro бесплатно. В компании говорят о дефиците вычислительных мощностей из-за высокого спроса на сервисы.
