В этой статье мы проведем сравнительный анализ трех нейросетей, предназначенных для генерации изображений, с акцентом на их удобство для пользователей из России. Мы рассмотрим основные параметры, тарифные планы и результаты тестирования каждой нейросети на ряде контрольных запросов на русском и английском языках.
Параметры нейросетей — на русском, бесплатно, с триал-периодом или Freemium. Для пользователей из РФ (поэтому DALL-E 2 и Midjourney в этом обзоре не участвуют).
Условия тестирования нейросетей для генерации изображений
Для тестирования каждой нейросети предоставлено три запроса:
- Первый запрос можно охарактеризовать как сложное описание сцены, требующее глубокого понимания и визуализации множества элементов, включая природные (осенние краски) и географические особенности (горная долина, вершины гор), действующих лиц (отряд путешественников), атмосферных условий (оттенки огня в небе, закат), а также их визуального взаимодействия. Этот запрос требует от нейросети способности адекватно интерпретировать и передавать сложные детали и визуальные элементы сцены на изображении.
- На русском — «Создать изображение горной долины в осенних красках, через которую идёт отряд путешественников, направляющихся к вершинам гор, на фоне заката, который окрашивает небо в оттенки огня»
- Он же на английском — «Create an image of a mountain valley in autumn colors, through which a group of travelers is passing, heading towards the mountain peaks, against the backdrop of a sunset that paints the sky in shades of fire»
- Второй запрос — дополнительно сложный из-за необходимости детальной работы с изображением человеческой руки, включая ее анатомические особенности (форма, пропорции, текстуры), позу (жест держания сумки), а также детали образа (молодая женщина в платье). Нейросети требуется преодолеть трудности в синтезе реалистичного изображения руки с учетом ее сложных анатомических деталей и позы, что может быть вызовом даже для современных моделей в 2024 году, учитывая особенности работы с пальцами.
- На русском: «Создать изображение руки молодой женщины в платье, держащей маленькую сумку»
- На английском: «Create an image of a young woman’s hand in a dress, holding a small purse»
- Третий запрос относительно простой, поскольку он не содержит сложных анатомических деталей или контекстуальных условий, которые могут создать трудности для нейросетей. Он требует отображения простой сущности — кота, без дополнительных требований к фону, позе или окружающей обстановке.
- На русском — «Нарисуй кота»
- На английском — «Draw a cat»
Оценка проводилась по 5-балльной системе, основанной на субъективном предпочтении и восприятии каждого изображения, созданного нейросетью.
Нейросети в обзоре:
- Stable Diffusion Online
- НейроТекстер
- Kandinsky 3.0
Stable Diffusion Online
- Сайт: stablediffusionweb.com/ru
- Тарифы: Бесплатно — 10 генераций изображений в день (с водяными знаками). Есть платные тарифы — Профессионал, Максимум.
- Регистрация: через аккаунты Google, через почту.
- Особенности: Stable Diffusion Online генерирует изображения по текстовому описанию на английском языке. Поэтому используем английский.
Нейросеть рисует

Природа хороша, Рериха напоминает. Вид прекрасный, но нет отряда путешественников. Путается в сложных запросах.

Путается при изображении кистей рук.
Третий запрос — бонусом к тестированию «Draw a cat» — «Нарисуй кота».

Кот хорош.
НейроТекстер
- Сайт: neuro-texter.ru
- Тарифы: Пробный период — 1100 бесплатных нейротокенов (одно изображение =700). Кто зарегистрируется по моей ссылке, получит +1100 нейротокенов. В сумме хватит на три изображения и останется на 1000 символов текста. Есть платные тарифы — Новичок, Профессионал, Контент-терминатор.
- Регистрация: через аккаунты Google, через почту.
- Особенности: Генерация изображений на русском языке, дружелюбная поддержка через чат.
Нейросеть рисует

Так-же похоже на картины Рериха. Будем считать, со сложным запросом справилась.
Второй контрольный запрос. «Создать изображение руки молодой женщины в платье, держащей маленькую сумку.»

С количеством пальцев справилась. Но сумка повисла в воздухе, как и предметы вокруг.
Третий запрос — бонусом к тестированию «Draw a cat» — «Нарисуй кота».

Кот хорош.
Kandinsky
Kandinsky 3.0 — нейросеть от «Сбера» для создания изображений.
- Сайт: см. варианты использования ниже:Есть шесть способов воспользоваться нейросетью Kandinsky 3.0:
- на сайте нейросети Fusion Brain;
- на сайте первой версии нейросети RuDALL-E;
- в телеграм-боте нейросети;
- в боте во «ВКонтакте»;
- в сервисе «Сбера» GigaChat;
- в Android-приложении «Салют» или на умном устройстве под управлением «Салют ТВ».
- Тарифы: бесплатно.
- Регистрация: на RuDALL-E — капча, на Fusion Brain — через Email.
- Особенности: Генерация изображений на русском и английском языках.
- генерация изображений;
- редактирования изображений;
- смешивание картинок.
- Примечание: Чем детальнее вы опишете задачу — тем лучше будет результат. Не забудьте указать стиль, в котором нейросеть должна нарисовать изображение. Его можно описать текстом или выбрать из списка.
Нейросеть рисует

Сложный запрос — хорошо.

Пальцы — не справилась.
Третий запрос там-же — «Нарисуй кота».

Кот — хорош.
Результаты тестирования
Проведено тестирование каждой нейросети на трех задачах:
- Создание изображения по сложному описанию сцены, требующему передачи множества деталей нейросетью;
- Изобразить руку молодой женщины в платье и с сумкой;
- Нарисовать кота без дополнительных деталей или условий.
Следует отметить, что оценка результатов тестирования проводилась субъективно, по пятибалльной системе и может отражать индивидуальное предпочтение и восприятие каждого изображения, созданного нейросетью.
Сводная таблица результатов
| Нейросеть | Сложный запрос | Пальцы | Кот | Итог |
|---|---|---|---|---|
| Stable Diffusion Online | 4 | 3 | 5 | 12 |
| НейроТекстер | 5 | 4 | 5 | 14 |
| Kandinsky 3.0 | 5 | 3 | 5 | 13 |
Заключение
Исходя из результатов тестирования, нейросеть «НейроТекстер» показала наилучшие результаты в общей сложности, обладая лучшим качеством генерируемых изображений и справляясь с более сложными запросами на русском языке. Нейросеть «Stable Diffusion Online» также представляет собой хороший вариант для пользователей, предпочитающих генерацию изображений на английском языке. Нейросеть «Kandinsky 3.0» показала приемлемые результаты, однако имеет некоторые ограничения при работе с некоторыми запросами.
Продолжение следует
Статья будет дополнена краткими обзорами других нейросетей для генерации изображений. Следите за обновлениями!
Другую нейросеть для генерации изображений из текста можно поискать тут https://list-ai.ru/preobrazovanie/tekst-v-izobrazhenie/.
