Google запустила Gemini Omni: ИИ для “создания чего угодно из чего угодно“

Видео
Поделиться
Новая модель способна генерировать и редактировать контент на основе текста, изображений, аудио и видео.

Компания Google представила новую мультимодальную модель искусственного интеллекта Gemini Omni, способную создавать видео из любой комбинации входных данных. Первой моделью в новой группе стала Gemini Omni Flash, которую уже начали интегрировать в приложение Gemini, сервис Google Flow и YouTube Shorts.

Как заявили в Google, Gemini Omni может "создавать что угодно из чего угодно", в частности сочетает возможности рассуждения ИИ Gemini со способностью генерировать и редактировать контент на основе текста, изображений, аудио и видео. В компании отметили, что модель способна менять отдельные объекты, среду, стиль или движение без потери контекста исходного ролика.

Gemini Omni также получила улучшенное понимание физических процессов. В компании заявили, что система лучше работает с моделированием гравитации, кинетической энергии и гидродинамики, что позволяет создавать более реалистичные сцены.

Отдельно Google акцентирует на способности Omni сочетать творчество со знаниями Gemini в сфере науки, истории и культуры. Модель может генерировать сложные объяснительные видео, в частности научные визуализации или образовательные ролики, на основе коротких текстовых запросов.

Система поддерживает комбинирование различных типов контента в одном проекте. Пользователи могут загружать изображения, видео, текстовые описания или аудиофайлы, а Omni будет создавать единый видеоклип с синхронизированными эффектами и стилистикой.

В Google также представили функцию Avatars, которая позволяет создавать цифрового аватара с собственным голосом и внешностью. Компания отмечает, что сейчас продолжает тестирование функций изменения голоса и языка для безопасного использования технологии.

Все видео, созданные через Gemini Omni, автоматически будут получать цифровой водяной знак SynthID. В Google заявили, что контент можно будет проверить через Gemini, Chrome и поиск Google.

Gemini Omni Flash уже начали разворачивать для подписчиков Google AI Plus, Pro и Ultra по всему миру. Также модель станет доступной бесплатно в YouTube Shorts и приложении YouTube Create. В ближайшие недели Google планирует открыть доступ к Omni через API для разработчиков и корпоративных клиентов.

В то же время Google представила масштабное обновление Поиска (Search) с новыми функциями искусственного интеллекта и агентскими возможностями. Отныне режим AI Mode будет работать на базе модели Gemini 3.5 Flash, которая станет моделью по умолчанию для пользователей во всем мире.

Поделиться
Заметили ошибку?

Пожалуйста, выделите ее мышкой и нажмите Ctrl+Enter или Отправить ошибку

Добавить комментарий
Всего комментариев: 0
Текст содержит недопустимые символы
Осталось символов: 2000
Пожалуйста выберите один или несколько пунктов (до 3 шт.) которые по Вашему мнению определяет этот комментарий.
Пожалуйста выберите один или больше пунктов
Нецензурная лексика, ругань Флуд Нарушение действующего законодательства Украины Оскорбление участников дискуссии Реклама Разжигание розни Признаки троллинга и провокации Другая причина Отмена Отправить жалобу ОК
Оставайтесь в курсе последних событий!
Подписывайтесь на наш канал в Telegram
Следить в Телеграмме