Нейросеть Кандинский: как пользоваться, описание, запросы

22.05.2023

Нейросеть Kandinsky от Сбера — хорошая и бесплатная альтернатива Midjorney с интерфейсом на русском языке. Как пользоваться сервисом, рассказываем в статье.

Кто такой Кандинский 

Нейросеть названа в честь Василия Васильевича Кандинского — русского художника, основателя абстракционизма. Он родился в 1866 году в Москве и умер в возрасте 77 лет в 1944 году во Франции. 

Кандинский учился на юридическом факультете Московского университета, изучал политическую экономию и статистику. В 1892 году будущий художник получил диплом и даже мог стать профессором, но судьба распорядилась иначе. Большую роль сыграла выставка импрессионистов в Москве, прошедшая в 1896 году. Впечатлившись картиной Моне «Стог сена», Кандинский оставил занятия наукой и уехал в Мюнхен учиться живописи. 

Кандинский и его кот Васька, 1910-е гг., wikipedia.org 

Во время учебы Василий Васильевич писал яркие пейзажные этюды, а вместо кисти использовал мастихин. К начинающему художнику относились снисходительно и даже подшучивали над его пестрыми работами. 

Мюнхенский пейзаж, Василий Кандинский, 1908

Как это обычно бывает, недооцененный художник стал одним из самых известных людей в мире искусства: именно Кандинский придумал абстракционизм, написал первую картину-абстракцию и описал теорию — художественные особенности нового стиля. Вместо реалистичных элементов в абстракционизме используются цвет и формы: линии, пятна, плоскости, геометрические фигуры. И нейросеть, которая получила имя знаменитого Художника, также умеет рисовать в этом стиле — но не только. 

Первая абстрактная картина (акварель), Василий Кандинский, 1910 

Интересный факт: в 2023 году на аукционе в Лондоне была продана картина Кандинского «Вид на Мурнау с церковью II», также известная как “Церковь в Мурнау”.  Лот оценили в 37,2 млн фунтов стерлингов (около $45 млн или 3,6 млрд рублей).

Церковь в Мурнау, Василий Кандинский, 1910

Нейросеть Кандинский: краткое описание 

Kandinsky — это нейросеть для генерации изображений, разработанная Сбером. Модель работает на 101 языке, но главное — на русском. Ее интерфейс будет интуитивно понятен любому пользователю из России и СНГ. В отличие от Midjorney, вводить запросы также можно на русском, а не на английском. А еще эта нейронка работает бесплатно — не то что зарубежные аналоги. 

Разработчики подробно рассказывают о нейросети в своем блоге. В нем можно почитать об архитектуре и деталях обучения модели. Мы же подробнее остановимся на практической части, а именно — как пользоваться нейросетью Kandinsky и что она умеет. 

Читайте нас там, где вам удобно:🔹Дзен🔹Вконтакте🔹Телеграм

Что умеет Kandinsky 

Последняя версия нейросети — Kandinsky 2.1. У нее есть 4 режима генерации: 

  • Генерация изображения по текстовому описанию.
  • Смешивание изображений — объединение двух картинок в одну. 
  • Создание вариаций — новых картинок по заданному примеру. 
  • Генерация по описанию и загруженному фото. 

Модель умеет создавать изображения в разных стиля. Вот полный список:

  • Аниме.
  • Детальное фото.
  • Киберпанк.
  • Кандинский.
  • Айвазовский.
  • Малевич.
  • Пикассо.
  • Гончарова.
  • Классицизм.
  • Ренессанс.
  • Картина маслом.
  • Рисунок карандашом.
  • Цифровая живопись.
  • Средневековый стиль.
  • Советский мультфильм.
  • 3D-рендер.
  • Мультфильм.
  • Студийное фото.
  • Портретное фото.
  • Мозаика.
  • Иконопись.
  • Хохлома.
  • Новый год.

Где попробовать нейросеть Kandinsky 

Сервис работает в нескольких форматах — и это удобно. 

  • В основном онлайн-редакторе Fusion Brain. Доступны все 23 стиля и 4 режима генерации. Также есть инструмент “Ластик”. С его помощью можно поправить изображение: стереть часть картинки, чтобы нейросеть заменила этот кусок. Максимальный размер итогового изображения — 768х768. Можно уменьшить его или поменять форму. 
  • Через Telegram‑бот Kandinsky 2.1. Работает быстро, доступны все режимы генерации, но только три стиля. Выбрать размер картинки нельзя. 
  • На сайте Rudalle. Доступна генерация по текстовому описанию и 19 стилей. Есть пять разрешений на выбор, максимальный размер картинки - 1536х768. 
  • Как навык голосового помощника Салют: команда «включи художника» запускает генерацию картинки по описанию голосом или текстом. Работает в приложении Салют и на умных устройствах Сбера. 
  • На платформе MLSpace (для ИП и организаций). Пригодится, если вы захотите развернуть нейросеть на собственном графическом процессоре.

Как пользоваться нейросетью Кандинский 

Мы опробовали три первых сервиса для работы с нейросетью: а именно, редактор Fusion Brain, бота в Телеграм и сайт Rudalle. 

Fusion Brain

Редактор достаточно простой — можно разобраться без инструкций. В левом верхнем углу находятся кнопки: 

  • стрелка — чтобы изменить размер будущей картинки;
  • лапка — перетащить поле с изображением в нужное место на экране;
  • картинка — для загрузки файлов для обработки;
  • ластик — для удаления частей картинки.

В левом нижнем углу вы увидите выпадающий список стилей. 

В самом низу — поле для ввода запросов (промтов). 

Задавать промты для Kandinsky можно по инструкции, которую Сбер опубликовал для GigaChat - ведь за генерацию картинок в новом чат-боте как раз отвечает нейросеть Kandinsky 2.1.

Формула хорошего описания выглядит так: 

Объект + описание внешности + дополнительные элементы + место + эффект + стиль (указывается в отдельном поле) 

Например: человек в шлеме, центральная площадь большого города, синий дым, стиль Киберпанк.

Получился человек не только в шлеме, но и в противогазе. Видимо, нейросеть ориентировалась на слово “дым”. 

Поменяем на “Средневековый стиль”, а описание оставим: 

Пугающий рыцарь на фоне пожара или восстания. Или всего вместе. 

Бот в Telegram 

Удобнее всего пользоваться нейросетью Кандинский 2.1 через Телеграм. Да, у бота меньше функций, чем у онлайн-редактора, да и работает он не быстро — зато через привычный мессенджер. 

Стилей здесь немного, поэтому мы сделали аниме-картинку.

Запрос: девушка, рыжие волосы, лес, солнце, много теплого света. Получилось четко по описанию. 

Rudalle 

На сайте Rudalle можно делать большие картинки — с разрешением 1536х768. Доступно много стилей, да и целом нет лишних функций. 

У сервиса есть один недостаток: перед каждой генерацией просят выровнять картинку (пройти капчу). Каждый раз! В Телеграм и Fusion Brain никаких проверок на роботов нет. 

Попробуем что-то сложное. Зеленый жук, поле, много ромашек, идет снег и светит солнце. А стиль — советского мультика.

Жук это еще и автомобиль, тут не поспоришь. Мы надеялись увидеть насекомое — но от него остались только усики, торчащие из крыши. Снега нет, зато ромашки и свет — в наличии. 

Попробуем стиль Кандинского: церковь в русской глуши, лес, деревья, свет солнца.

Абстракция удалась, церковь в лесу угадывается.

Кстати, первую иллюстрацию для статьи мы тоже сгенерировали в Rudalle. В ней зашифровано описание известной картины русского художника Серова, но применен стиль Кандинского. Узнаете? 

Читайте также: