Поделиться

Semantic Style Transfer with CLIP+VQGAN

нейросеть Semantic Style Transfer with CLIP+VQGAN

Нейросеть Semantic Style Transfer изменяет стиль изображения на основе введенного текста, имеет ограничения и поддерживает пользовательские GANы.

Область применения : Дизайн, Иллюстрация, Разработка игр, Анимация, Производство фильмов, Композитинг, Real-time производство

Преобразование : Изображение-текст-изображение

Задача : Перенести стиль


Подробнее о этой нейросети

Нейросеть Semantic Style Transfer with CLIP+VQGAN является искусственным интеллектом, разработанным для изменения стиля изображений на основе ввода текста. Она использует метод маскировки с логитными значениями и оптимизацию с помощью сферической геодезической и метода перевзвешивания. Однако, данная нейросеть имеет некоторые ограничения, связанные с ограничениями модели CLIP и настройкой маски для каждого изображения. При использовании интерактивного редактирования результат необходимо загружать на imgur каждый раз. Кроме того, нейросеть поддерживает пользовательские GANы. В каталоге доступна предварительно обученная модель VQGAN Wikiart 16k, а также планируется улучшить маскировку и добавить новые функции. Работа нейросети основана на сегментации изображения на основе указанного текста и применении заданного стиля к объекту на изображении.

Поделиться