Компанія OpenAI, яка розробила знаменитий чат-бот ChatGPT, випустила новий інструмент під управлінням штучного інтелекту. Він отримав назву Sora та призначений для генерації відео на основі текстового запиту.
Як розповіли розробники, Sora створює відео завдовжки до хвилини. Вона також здатна генерувати відео зі статичних зображень, а також заповнювати відсутні кадри в існуючих роликах або розширювати їх. І, дивлячись на приклади робіт, які представила компанія, виходить у неї досить правдоподібно.
«Sora здатна створювати складні сцени з кількома персонажами, певними типами руху та точними деталями об'єкта та фону. Модель розуміє не лише те, що користувач запросив у командному рядку, а й те, як ці речі існують у фізичному світі», - йдеться у прес-релізі компанії.
Розробники визнають, що модель має і слабкості. Так, у неї можуть виникнути проблеми з точним моделюванням фізики та розумінням складної сцени. Вона також може не до кінця розуміти причинно-наслідкові зв'язки. Наприклад, людина може відкусити від печива, але не на ньому залишиться слідів укусу. Модель також може плутати, наприклад, ліворуч і праворуч.
Поки що інструмент не доступний широкому колу користувачів. OpenAI відкрила його для фахівців, які мають виявити його слабкі місця. Крім того, Sora доступна деяким художникам, дизайнерам та режисерам. Це зроблено для того, щоб зібрати відгуки щодо її роботи.
Раніше компанія Meta, яка є власником соціальних мереж Facebook, Instagram і Threads, заявила, що на вказаних платформах планує позначати всі зображення, створені за допомогою штучного інтелекту.