Область применения : Дизайн, Иллюстрация, Разработка игр, Анимация, Производство фильмов, Композитинг, Real-time производство
Преобразование : Изображение-текст-изображение
Задача : Перенести стиль
Подробнее о этой нейросети
Нейросеть Semantic Style Transfer with CLIP+VQGAN является искусственным интеллектом, разработанным для изменения стиля изображений на основе ввода текста. Она использует метод маскировки с логитными значениями и оптимизацию с помощью сферической геодезической и метода перевзвешивания. Однако, данная нейросеть имеет некоторые ограничения, связанные с ограничениями модели CLIP и настройкой маски для каждого изображения. При использовании интерактивного редактирования результат необходимо загружать на imgur каждый раз. Кроме того, нейросеть поддерживает пользовательские GANы. В каталоге доступна предварительно обученная модель VQGAN Wikiart 16k, а также планируется улучшить маскировку и добавить новые функции. Работа нейросети основана на сегментации изображения на основе указанного текста и применении заданного стиля к объекту на изображении.
