Компания Apple запустила инструмент под управлением искусственного интеллекта, который позволит пользователям с помощью текста описать, что они хотят изменить в изображении. Модель, получившая название MGIE, была создана в сотрудничестве с Калифорнийским университетом в Санта-Барбаре, сообщает The Verge.
Модель позволяет обрезать, изменять размер, переворачивать и добавлять фильтры к изображениям с помощью текстовых подсказок.
MGIE означает MLLM-Guided Image Editing, модель можно применять как для простых, так и более сложных задач по редактированию изображения. Например, она может изменить отдельные объекты на фотографии, придав им новую форму или сделав ярче.
MGIE использует две различные мультимодальные языковые модели. Она учится интерпретировать подсказки пользователя. Затем она «представляет», как будет выглядеть редактирование (например, запрос на более синее небо на фотографии приводит к увеличению яркости части изображения с небом).
Для того, чтобы отредактировать изображение с помощью модели, пользователю нужно просто написать, что он хочет изменить. Например, отредактировать изображение пиццы, написав «сделай ее более здоровой».
Apple выставила MGIE для скачивания через GitHub, а также выпустила веб-демонстрацию Hugging Face Spaces. Вместе с тем, в компании не уточнили, что планируют делать с моделью после исследования.
Ранее Google представила новый инструмент ImageFX под управлением искусственного интеллекта, предназначенный для превращения текста в изображение.