Объясняем на котиках: как правильно составлять запросы для нейросетей, чтобы получить красивый рисунок
Разбираемся, как правильно общаться с нейросетями для генерации картинок. Все примеры — с котами.
Оглавление
- Сначала опишите главный объект
- Опишите фон
- Используйте разные стили
- Избегайте причастия и деепричастия
- Не используйте отрицания
- Позвольте нейросети думать за вас
- Пробуйте готовые промты
Мы уже рассказывали, как создавать картинки с помощью Midjourney, Kandinsky и Stable Diffusion. В этой статье подробнее остановимся о главных принципах, которые помогут написать понятный промт.
Для генерации картинок мы использовали Кандинский и Шедеврум. Эти нейросети понимают запросы на русском языке и работают бесплатно, без ограничений на количество генераций.
Сначала опишите главный объект
Вначале запроса укажите главный объект изображения: кот, девушка, море, лес, машина и т.п. Для однообразия примеров будем генерировать разных котиков.
Тут же добавьте его характеристики: черный кот, пушистый кот, серый кот и т.п. При этом можно использовать естественный порядок слов: например, «рыжий кот», а не «кот рыжий».
рыжий пушистый кот
Раньше эксперты рекомендовали перечислять все параметры через запятую, но сегодня нейросети понимают и сложные описания. Не стоит этим злоупотреблять, но можно и поэкспериментировать. Например, Кандинский даже без запятых понял огромное описание кота и выдал точное изображение:
рыжий кот с кисточками на ушах и пятном на носу и зелеными глазами и белыми полосками
А еще объектов может быть несколько:
красивая девушка и рыжий кот
Вначале также можно указать положение объекта в кадре или его действие: кот бежит, кот лежит, кот сидит.
кот сидит
Опишите фон
Когда выбрали основной объект, напишите, на фоне чего он находится.
Например:
черный кот на траве
пушистый кот на фоне неба
серый кот под лампой
рыжий кот под лампой
Фон можно и не указывать, все зависит от вашей фантазии. Вместо фона можете описать объекты рядом, освещение или нужные эффекты: теплый свет, много света, светит солнце, неоновый свет и т.п.
Используйте разные стили
Например, в Кандинском можно указать стилистику в отдельном списке. А в Midjourney этот параметр надо прописать в промте через тег «in the style of» или «by [ имя художника ]».
Не бойтесь экспериментировать со стилями — может получиться что-то интересное. Но лучше всего, чтобы сюжет изображения соответствовал выбранному жанру или художнику. Например, в стиле Айвазовского лучше рисовать море, а не котиков. Но мы все же попробовали: облака на фоне выглядят очень художественно. А еще на картинке есть море — куда же без него!
Возможно, это потерянная картина Айвазовского, но это не точно.
По тому же промту сделали картинку в стиле киберпанк. Тоже получилось хорошо — на фоне город, у кота на плечах какая-то броня, а под ушками наушники.
Избегайте причастия и деепричастия
Нейросети уже лучше понимают сложные описания, но если вы хотите ускорить процесс генерации, упрощайте промт.
Например:
не «окрашенный в светло-оранжевый цвет быстро бегущий кот», а «рыжий кот бежит, скорость»
Не используйте отрицания
Как показывает практика, нейросети лучше обрабатывают запросы без отрицаний. Поэтому старайтесь создавать промты без негативных слов: не, без, кроме, исключая, вместо.
В Midjourney есть параметр «--no», если вам надо исключить что-то на картинке. В русскоязычных сервисах мы такого параметра не нашли, а частицу «не» они не понимают.
Например: не стоит писать «не черный кот». Нейросеть увидит слово «черный» и нарисует именно черного кота.
Лучше указать другой цвет без отрицаний:
серый кот лежит на фоне неба
Позвольте нейросети думать за вас
Не злоупотребляйте огромными запросами, в которых описан каждый пиксель картинки. Это усложнит задачу для нейросети, а значит выше вероятность, что получится совсем не то, что вы хотели.
Попробуйте сначала создать короткий промт с описанием самых важных деталей — возможно, результат вас приятно удивит. В общем, позвольте роботам думать за вас — не зря же их обучали на огромном количестве данных.