Google DeepMind представила Nano Banana 2 (Gemini 3.1 Flash Image) — оновлену модель генерації зображень, що поєднує швидкість Flash із функціональністю Pro, яку раніше обмежували для користувачів через високий попит. Вона вже доступна в продуктах компанії, включно з додатком Gemini, Google Ads та Vertex AI. Розробники заявляють про розширені знання, покращену візуальну точність і підтримку виробничих форматів до 4K.
Поєднання Flash та Pro
Nano Banana 2 поєднує швидкість Gemini Flash із можливостями, раніше доступними лише у версії Pro. Через це модель забезпечує одразу й ефективне редагування та ітерацію зображень, а також розширене дотримання складних інструкцій користувача.
Інформація для генерації
Система використовує базу знань Gemini та дані в режимі реального часу, зокрема з вебпошуку, щоб точніше відтворювати конкретні теми. Це дає змогу створювати інфографіку, перетворювати нотатки на діаграми й генерувати візуалізації даних.
Текст на зображеннях
Nano Banana 2 підтримує точне відтворення та переклад тексту на зображеннях. Користувачі можуть створювати маркетингові макети, логотипи, запрошення чи постери з чітким текстом різними мовами, а також локалізувати написи для міжнародної аудиторії.
Точне відтворення історій
Оновлення також стосуються творчого контролю та візуальної точності. Модель підтримує схожість до п’яти персонажів і точність до 14 об’єктів у межах одного робочого процесу, що дозволяє будувати історії без втрати цілісності зображення.
Дотримання інструкцій та практичні характеристики
Розробники наголошують на розширеному дотриманні інструкцій і підтримці різних співвідношень сторін та роздільної здатності від 512 пікселів до 4K. Окремо підкреслюється покращене освітлення, текстури та деталізація при збереженні швидкості обробки.
Де знайти Nano Banana 2
Модель інтегрована в додаток Gemini, де замінить Nano Banana Pro у режимах Fast, Thinking і Pro. Передплатники Google AI Pro та Ultra збережуть доступ до Nano Banana Pro для спеціалізованих завдань через функцію повторної генерації. Nano Banana 2 працює у 141 країні й вісьмома додатковими мовами. Модель також доступна в:
- Пошуку в режимі штучного інтелекту;
- Google Lens;
- AI Studio;
- Gemini API в режимі попереднього перегляду;
- Vertex AI через Google Cloud;
- Flow як стандартна модель без списання кредитів;
- Google Ads для створення рекламних кампаній.
Для ідентифікації матеріалів, створених ШІ, застосовується невидимий водяний знак SynthID і сумісні облікові дані C2PA, що дозволяють з’ясувати не лише факт використання ШІ, а й спосіб його застосування. Із листопада функцію перевірки SynthID у додатку Gemini використали понад 20 мільйонів разів різними мовами. Найближчим часом перевірка C2PA також з’явиться в Gemini.
На початку лютого аудиторія чат-бота Gemini зросла до 750 мільйонів активних користувачів на місяць, випередивши показники Meta AI, але все ще поступаючись лідеру ринку — ChatGPT. Стрімкий ривок пов’язують із запуском нової моделі Gemini 3 та впровадженням більш доступного тарифного плану Google AI Plus за $7,99.
