Компания OpenAI, которая разработала знаменитый чат-бот ChatGPT, выпустила новый инструмент под управлением искусственного интеллекта. Он получил название Sora и предназначен для генерации видео на основании текстового запроса.
Как рассказали разработчики, Sora создает видео длиной до минуты. Она также способна генерировать видео из статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их. И, судя по примерам работ, которые представила компания, выходит у нее достаточно правдоподобно.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
«Sora способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель понимает не только то, что пользователь запросил в командной строке, но и то, как эти вещи существуют в физическом мире», - говорится в пресс-релизе компании.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Разработчики признают, что у модели есть и слабости. Так, у нее могут возникнуть проблемы с точным моделированием физики и пониманием сложной сцены. Она также может не до конца понимать причинно-следственные связи. Например, человек может откусить от печенья, но на том не останется следов укуса. Модель также может путать, например, лево и право.
Пока инструмент не доступен широкому кругу пользователей. OpenAI открыла его для специалистов, которые должны выявить его слабые места. Кроме того, Sora доступна некоторым художникам, дизайнерам и режиссерам. Это сделано для того, чтобы собрать отзывы об ее работе.
Ранее компания Meta, являющаяся владельцем социальных сетей Facebook, Instagram и Threads, заявила, что на указанных платформах планирует обозначать все изображения созданные с помощью искусственного интеллекта.