Объясняем на котиках: как правильно составлять запросы для нейросетей, чтобы получить красивый рисунок

01.08.2023

Разбираемся, как правильно общаться с нейросетями для генерации картинок. Все примеры — с котами.

Оглавление

Мы уже рассказывали, как создавать картинки с помощью Midjourney, Kandinsky и Stable Diffusion. В этой статье подробнее остановимся о главных принципах, которые помогут написать понятный промт. 

Для генерации картинок мы использовали Кандинский и Шедеврум. Эти нейросети понимают запросы на русском языке и работают бесплатно, без ограничений на количество генераций. 

Сначала опишите главный объект 

Вначале запроса укажите главный объект изображения: кот, девушка, море, лес, машина и т.п. Для однообразия примеров будем генерировать разных котиков. 

Тут же добавьте его характеристики: черный кот, пушистый кот, серый кот и т.п. При этом можно использовать естественный порядок слов: например, “рыжий кот”, а не “кот рыжий”. 

рыжий пушистый кот

Шедеврум

Раньше эксперты рекомендовали перечислять все параметры через запятую, но сегодня нейросети понимают и сложные описания. Не стоит этим злоупотреблять, но можно и поэкспериментировать. Например, Кандинский даже без запятых понял огромное описание кота и выдал точное изображение: 

рыжий кот с кисточками на ушах и пятном на носу и зелеными глазами и белыми полосками 

Кандинский

А еще объектов может быть несколько: 

красивая девушка и рыжий кот

Кандинский

Вначале также можно указать положение объекта в кадре или его действие: кот бежит, кот лежит, кот сидит.

кот сидит

Кандинский

Опишите фон

Когда выбрали основной объект, напишите, на фоне чего он находится. 

Например: 

черный кот на траве 
пушистый кот на фоне неба 

серый кот под лампой
рыжий кот под лампой

Кандинский

Фон можно и не указывать, все зависит от вашей фантазии. Вместо фона можете описать объекты рядом, освещение или нужные эффекты: теплый свет, много света, светит солнце, неоновый свет и т.п. 

Используйте разные стили

Например, в Кандинском можно указать стилистику в отдельном списке. А в Midjourney этот параметр надо прописать в промте через тег “in the style of” или “by [ имя художника ]”. 

Не бойтесь экспериментировать со стилями — может получиться что-то интересное. Но лучше всего, чтобы сюжет изображения соответствовал выбранному жанру или художнику. Например, в стиле Айвазовского лучше рисовать море, а не котиков. Но мы все же попробовали: облака на фоне выглядят очень художественно. А еще на картинке есть море — куда же без него!

Кандинский, стиль Айвазовского

Возможно, это потерянная картина Айвазовского, но это не точно. 

По тому же промту сделали картинку в стиле киберпанк. Тоже получилось хорошо — на фоне город, у кота на плечах какая-то броня, а под ушками наушники.

Кандинский, стиль киберпанк

Избегайте причастия и деепричастия 

Нейросети уже лучше понимают сложные описания, но если вы хотите ускорить процесс генерации, упрощайте промт. 

Например:
не “окрашенный в светло-оранжевый цвет быстро бегущий кот”, а "рыжий кот бежит, скорость"

Кандинский

Не используйте отрицания 

Как показывает практика, нейросети лучше обрабатывают запросы без отрицаний. Поэтому старайтесь создавать промты без негативных слов: не, без, кроме, исключая, вместо. 

В Midjourney есть параметр “--no”, если вам надо исключить что-то на картинке. В русскоязычных сервисах мы такого параметра не нашли, а частицу "не" они не понимают.

Например: не стоит писать "не черный кот". Нейросеть увидит слово "черный" и нарисует именно черного кота.

Шедеврум

Лучше указать другой цвет без отрицаний:

серый кот лежит на фоне неба 

Шедеврум

Позвольте нейросети думать за вас 

Не злоупотребляйте огромными запросами, в которых описан каждый пиксель картинки. Это усложнит задачу для нейросети, а значит выше вероятность, что получится совсем не то, что вы хотели. 

Попробуйте сначала создать короткий промт с описанием самых важных деталей — возможно, результат вас приятно удивит. В общем, позвольте роботам думать за вас — не зря же их обучали на огромном количестве данных. 

Шедеврум

Пробуйте готовые промты 

Их можно найти в группах Discord и на Reddit, на тематических форумах и в соцсетях. Если хотите глубже разобраться в алгоритмах работы нейросетей — идите на Github и Хабр. Там есть даже материалы от разработчиков, которые эти самые нейросети и обучают.

Читайте также: