Компанія Apple запустила інструмент під керуванням штучного інтелекту, який дозволить користувачам за допомогою тексту описати, що вони хочуть змінити зображення. Модель, що отримала назву MGIE, була створена у співпраці з Університетом Каліфорнії в Санта-Барбарі, повідомляє The Verge.
Модель дозволяє обрізати, змінювати розмір, перевертати та додавати фільтри до зображень за допомогою текстових підказок.
MGIE означає MLLM-Guided Image Editing, модель можна застосовувати як для простих, так і складніших задач з редагування зображення. Наприклад, вона може змінити окремі об'єкти на фотографії, додавши їм нову форму або зробивши яскравішими.
MGIE використовує дві різні мультимодальні мовні моделі. Вона навчається інтерпретувати підказки користувача. Потім вона «уявляє», як виглядатиме редагування (наприклад, запит на синє небо на фотографії призводить до збільшення яскравості частини зображення з небом).
Для того, щоб відредагувати зображення за допомогою моделі, потрібно просто написати, що користувач хоче змінити. Наприклад, відредагувати зображення піци, написавши «зроби її здоровішою».
Apple виставила MGIE для завантаження через GitHub, а також випустила веб-демонстрацію Hugging Face Spaces. Водночас у компанії не уточнили, що планують робити з моделлю після дослідження.
Раніше Google представила новий інструмент ImageFX під керуванням штучного інтелекту, призначений для перетворення тексту на зображення.