8 необычных сервисов, где нейросеть рисует по словам

Современные технологии развиваются так стремительно, что нейросети, совсем недавно бывшие лишь нелепой забавой, сегодня стали серьезными и эффективными помощниками человека. Причем не только в механической работе, требующей точности в изучении огромного массива данных, но и в творческих задачах. Уже сейчас нейросеть рисует картины, портреты и делает фотореалистичные изображения по простому текстовому описанию.

Содержание

Что такое нейросеть
Kandinsky 3.1 — нейросеть, которая понимает русский
Шедеврум — нейросеть для тех, кто любит делиться
Stable Diffusion — нейросеть на вашем компьютере
DALL-E 3 — нейросеть, которая точно вас поймет
GLIDE — нейросеть для рисования
GauGAN 2 — нейросеть, которая рисует картинку по запросу
DALL·E mini — нейросеть рисует портреты
Dream by Wombo — нейросеть рисует картины по словам

Что такое нейросеть

Прежде чем разбираться с художественными навыками нейросетей, стоит для начала понять, что же это такое — нейронная сеть (она же artificial neural network в английском наименовании). Термин нейросеть своими корнями уходит к исследованиям работы мозга человека и в наши дни применяется к свободно связанному семейству моделей, которые характеризуются большим параметрическим пространством и гибкой структурой. Непонятно? Ничего удивительного, ведь и работа самих нейросетей не самая простая для человека неподготовленного.

Но, кроме шуток, нейросеть работает по принципу человеческого мозга — он состоит из нейронов, которые связаны передающими электрохимические импульсы синапсами — а в нейросети роль нейронов играют вычислительные элементы, которые имитируют мозг человека.

Правда, несмотря на все достижения науки, пока нейросети требуют большого количества технических ресурсов, включая мощнейшие компьютеры, а также не могут соперничать с мозгом человека, где и синапсов больше, и работать они могут параллельно друг с другом. А нейросети пока функционируют лишь через разделение любой, даже самой простой задачи, на череду последовательных шагов к её выполнению. Но уже сейчас нейронные сети способны существенно помогать человеку в повседневных задачах.

Нейросетям доверено распознавать лица в системах видеонаблюдения, диагностировать болезни при анализе данных пациентов, заменять человека в колл-центрах в роли голосовых помощников да даже привычные всем чат-боты тоже используют в своей основе принцип нейронных сетей. Сервисы по имитации голосов и созданию изображений-дипфейков построены также на нейросетях. А в последнее время нейронным сетям доверили даже творческие задачи — написание стихов и рекламных слоганов, сочинение музыки и сценариев для фильмов, разработку и визуализацию промышленного дизайна, а кроме того — превращение слов в изображение.

Технологии
Что такое нейросеть простым языком: как она работает и что умеет

Kandinsky 3.1 — нейросеть, которая понимает русский

За прошедшие с момента своего появления годы нейросеть Сбера сильно изменилась, и если раньше она заметно уступала Midjourney, Stable Diffusion и другим популярным зарубежным аналогам, то с выходом Kandinsky 3.1 качество генерации резко выросло. Нейросеть научилась делать, в том числе, и фотореалистичные изображения, с трудом отличимые от снимков на обычную камеру.

Самое же главное в том, что нейросеть ориентирована на русскоязычную аудиторию и прекрасно знакома с русской культурой и фольклором. Работать же с ней можно как через официальный сайт нейросети и Телеграм-бота, так и через популярную у нас социальную сеть ВКонтакте. Регистрация для ее использования необязательна, а сама нейросеть полностью бесплатна.

8 сервисов, где нейросети рисуют картинку по описанию

Возможности у Kandinsky 3.1, кстати, действительно очень широкие. Нейросеть не только умеет генерировать изображения «с нуля», но и позволяет дорисовывать и миксовать уже имеющиеся рисунки или фотографии, генерировать анимации и даже короткие видео продолжительностью до 6 секунд с разрешением 512 пикселей. Причем такие видео могут создаваться как по текстовому описанию, так и по загруженным изображениям, а вы сможете указать высоту и ширину кадра, динамичность ролика и его частоту кадров.

Шедеврум — нейросеть для тех, кто любит делиться

Нейросеть от Яндекса использует генеративную модель YandexART и создает изображения методом каскадной диффузии. Она обучена на 330 миллионах специально отобранных картинок с текстовыми описаниями. В самой же компании позиционируют ее как отличный инструмент для творчества с возможностью поделиться им с другими пользователям.

И именно последним Шедеврум кардинально отличается от аналогов. Ведь, по сути, он представляет собой еще и социальную сеть, в которой пользователи могут подписываться на нейрохудожников и даже оставлять лайки и комментарии к их произведениям. Если же вы достигните определенных успехов и станете популярны, у вас появится возможность генерации еще и 4-секундных видеороликов. В открытом доступе такая функция пока отсутствует.

Еще одно важное отличие Шедеврума в том, что он работает только в мобильном приложении для Android и iOS. Генерировать изображения с помощью сайта нейросети не получится — на нем можно увидеть лишь уже готовые картинки других нейрохудожников.

Технологии
Влюбиться в нейросеть: 5 историй, в которые трудно поверить

Что касается качества генерации, то здесь он вполне на уровне Midjourney и Stable Diffusion предыдущих версий. На создание изображения нейросеть тратит около минуты, а ее точность, как это обычно бывает, зависит от полноты описания того, что вы хотите получить. Есть у Шедеврума и возможность «допилить» готовое изображение или фотографию.

Stable Diffusion — нейросеть на вашем компьютере

Stable Diffusion не только построена на открытом исходном коде. Она полностью бесплатна и предлагает множество вариантов доступа. Чего только стоит возможность установить ее на собственный компьютер. Причем особо мощный ПК для этого не нужен — достаточно, чтобы он имел видеокарту Nvidia 10XX или свежее с 4 Гбайт видеопамяти. Поддержать разработчиков деньгами вы, конечно, можете, но это совсем необязательно — сервис полностью бесплатен.

Stable Diffusion немного уступает тому же Midjourney по выразительности рисовки, но и результаты, выдаваемые нейросетью, более предсказуемы и точнее отвечают введенным запросам.

Технологии
Нейросеть на вашем ПК: как установить и пользоваться Stable Diffusion

DALL-E 3 — нейросеть, которая точно вас поймет

В 2021 году одно из детищ Илона Маска, занимающаяся разработкой и лицензированием технологий на основе машинного обучения американская компания OpenAI, представила нейросеть DALL-E, способную создавать изображение по его текстовому описанию. Опыт был признан удачным и в 2022 году анонсировали DALL-E 2, а годом позднее на свет появилась DALL-E 3.

Главная «фишка» нейросети в том, что для получения хорошего результата вам не нужно быть специалистом в написании промтов и их синтаксисе. DALL-E 3 прекрасно понимает не только простую разговорную речь, но и разбирается в смайликах, а сгенерированное изображение можно доработать, внеся в него нужные правки.

DALL-E 3 прекрасно разбирается в мемах и поп-культуре, но имеет серьезные ограничения в плане авторских прав, не давая генерировать персонажей и сцены из реальных фильмов и произведений искусства. Есть у нее пунктики и по поводу насилия и NSFW-контента.

GLIDE — нейросеть для рисования

Все та же OpenAI представила в 2021 году нейросеть GLIDE, которая способна обрабатывать загруженные изображения, а также генерировать уникальные иллюстрации на основе их текстового описания. С помощью сервиса можно добавлять на изображения различные элементы, причем GLIDE может работать не только с фотографиями, но и рисунками — в обоих случаях нейронная сеть «считывает» стиль исходной иллюстрации, что позволяет гармонично вписывать новый объект, адаптируя его под общий стиль изображения.

По качеству своей работы новая нейросеть превосходит DALL-E и даже может качественно справляться с необычными заданиями, но и как любая нейросеть периодически GLIDE способна дать сбой при выполнении самого простого запроса. Описание своего проекта разработчики из OpenAI представили в виде научной публикации на портале arXiv.org, а также выложили на GitHub исходный код сокращенной версии нейросети для тестов всеми заинтересовавшимися проектом.

Так что если вы захотите воспользоваться наработками команды инженеров OpenAI, то придется скачать опубликованный ими код и самостоятельно организовать на своих мощностях собственную нейросеть. Если возможности такой нет, то придется воспользоваться другими вариантами сервисов из нашей подборки.

Технологии
Может ли нейросеть написать хорошую сказку? Мы проверили

GauGAN 2 — нейросеть, которая рисует картинку по запросу

Еще один американский технологический гигант — компания Nvidia — который специализируется на разработке графических процессоров и систем на чипе снискал себе славу в индустрии видеоигр, сфере профессиональной визуализации, областях высокопроизводительных вычислений и беспилотных автомобилях, которые используют бортовые компьютеры Nvidia, также не остался в стороне от нейросетей. В 2019 году появилась нейронная сеть GauGAN, генерирующая изображения на основе эскизов, а под конец 2021 года создали GauGAN 2.

Основной фишкой GauGAN 2 (имя ей дал французский постимпрессионист Поль Гоген) стало умение создавать иллюстрации на основе текстовых описаний. Для обучения использовался суперкомпьютер NVIDIA Selene, десятки миллионов высококачественных изображений и текстов, на основе которых нейросеть тренировалась устанавливать связь между словами и иллюстрациями, стилем текста и готовым изображением.

В демонстрационном режиме GauGAN 2 доступна на сайте компании-разработчика, а вот первую версию своей нейросети Nvidia воплотила в релизном продукте — алгоритмы нейронной сети работают с изображениями в редакторе Canvas, воспользоваться которым можно на официальном сайте проекта.

Художник и нейросеть показали, как выглядели бы исторические личности сегодня — Наполеон, Джордж Вашингтон, Моцарт и другие

DALL·E mini — нейросеть рисует портреты

Упрощенный вариант нейросети для создания иллюстраций по их текстовому описанию от компании Илона Маска. Основное отличие от проекта DALL-E 2 заключается в том, что эта нейросеть генерирует изображения в открытом доступе и воспользоваться ею может любой желающий, причем совершенно бесплатно.

Минусов, учитывая бесплатность и общедоступность нейросети, тоже хватает. Во-первых, официальный сайт сервиса не всегда работает из-за наплыва трафика. Во-вторых, время ожидания готового результата (достаточно просто ввести описание желаемой иллюстрации на английском языке и нажать кнопку Draw) может составлять десятки минут. В-третьих, сохранить можно изображение только в не самом высоком качестве. Зато на выходе по одному запросу нейросеть позволяет получить сразу девять иллюстраций.

Dream by Wombo — нейросеть рисует картины по словам

По своим возможностям нейросеть от канадского стартапа похожа на DALL·E mini, но отличия все-таки есть. К схожим чертам можно отнести предельно простой интерфейс — на сайте достаточно указать описание (но только на английском языке и описание должно укладываться в 200 символов) и кликнуть по клавише Create, чтобы получить иллюстрацию. В остальном — различия.

Dream by Wombo специализируется только на вертикальных иллюстрациях и это важно иметь ввиду перед началом работы. Зато нейросеть позволяет выбрать стиль готового изображения из предложенных на сайте вариантов (или отказаться от этого и довериться «вкусу» платформы), а при желании и вовсе можно прикрепить референсную картинку, чтобы попытаться получить на выходе похожую иллюстрацию. Если не выйдет — можно тут же «перегенерировать» получившееся изображение. Зато все бесплатно.

P.S. Иллюстрации в разделах о нейросетях Kandinsky 2.1, Stable Diffusion, GauGAN 2, ruDALL-E, DALL·E mini и Dream by Wombo показывают то, как нейронные сети представляют себе слово iChip — в большинстве случаев название нашего издания вызывает у нейросетей космические или киберпанковские «ассоциации».

Читайте также