Нейросеть по пятницам: тестируем GigaChat MAX, обновленную модель от Сбера

08.11.2024

В октябре Сбер представил нейросетевую модель GigaChat MAX, которая лучше предыдущей версии решает задачи, запоминает больше контекста бесед, может распознавать печатный и рукописный тексты, а еще умеет работать с картинками. Мы решили попробовать ее в разных режимах и понять, действительно ли это практичный инструмент в руках умелого пользователя.

Не нужно быть крутым специалистом в области AI, чтобы предсказать прогресс нейросетей. Они становятся лучше с каждым годом и даже месяцем, хотя обычные пользователи этого могут не замечать. Когда обновлений накапливается достаточно много, разработчики формируют новую модель нейросети. Старые, кстати, тоже остаются актуальными — например, они могут быть использованы для простых задач или в бесплатных аккаунтах, если предусмотрены платные. 

GigaChat всегда был бесплатным. Причем не потому, что работал хуже других — напротив, модель MAX, которую Сбер представил в октябре 2024 года, по оценке бенчмарка MERA входит в число мировых лидеров. Мы писали о возможностях еще бета-версии, пользовались этой нейросетью в работе, а теперь решили изучить последнюю версию и рассказать о ее возможностях. Впрочем, многое точно останется за кадром: к примеру, GigaChat MAX стал решать задачи на 25% лучше, но вряд ли мы сможем проверить это на примерах. 

Решение задач

Современным школьникам остается только позавидовать: нейросети легко решают все задачи школьной программы. Теперь не надо ждать маму или папу с работы, чтобы сделать домашнее задание. Правда, остается возможность просто списать решение, но халтурщики отлично делали это еще до появления нейросетей. Мы попробовали решить с помощью GigaChat MAX задачу по геометрии для старшеклассников. 

Обращает на себя внимание подробное изложение решения. То есть нейросеть не просто дает ответ, а объясняет, как его получить. Это очень полезно для тех, кто хочет разобраться, а не списать. 

Мы решили попробовать и более абстрактную задачу. 

Помоги решить такую задачу. В тексте начинающего автора было 40% полезной информации. После редактирования более опытным коллегой ее стало 90%. Посчитай, во сколько раз уменьшилось количество бесполезной информации.

Вариант решения от GigaChat MAX: 

Заметьте, мы в условии мы нигде не описывали, что такое бесполезный объем. Нейросеть поняла, что это то, что не относится к полезному. Ну и решила задачу, конечно, точно. 

Готовые ответы

Если поисковые машины могут дать лишь ссылки на самые релевантные (подходящие) ресурсы, нейросети сразу готовят ответ. Фактически они могут играть роль виртуального советчика, который использует в своей работе большой массив данных. Попробуем уточнить у него что-то полезное. 

Представь, что ты автор популярного издания о смартфонах. Напиши список из 7 лучших моделей смартфонов в 2024 году.

Вариант от нейросети: 

Кажется, кто-то торопит события. Если в мире где-то есть Apple iPhone 17 Pro Max за 150 000 рублей, везите нам его прямо сейчас! Да и Samsung Galaxy S25 Ultra бы тоже взяли с удовольствием. На самом деле правильность ответов на вопросы зависит от формулировки промпта (запроса) и актуальности массива информации, на котором обучалась нейросеть. Если очень захочется, можно добиться более-менее адекватных результатов. 

С технической информацией у нейросетей всегда были проблемы. Тот же ChatGPT неоднократно «косячил», когда мы просили составить его список характеристик определенного смартфона. С бытовыми темами гораздо проще. Например, мы попросили найти рецепт салата, который можно приготовить за час. 

Через час ко мне придут гости. Можешь посоветовать рецепт какого-нибудь салата без сложных ингредиентов, который можно сделать за час?

В ответе — подробный рецепт «Цезаря», который мы не будем приводить целиком в целях экономии места. 

Радует не только качество ответа, но и его оформление. Список ингредиентов оформлен именно списком, порядок действий пронумерован, разве что не указано количество порций, сколько в итоге получится. 

Можно узнать еще массу другой полезной информации. Например...

Я хочу поехать в Таиланд. Расскажи, в какое время лучше это сделать и почему

Вариант от нейросети: 

Довольно содержательный ответ на простой вопрос. Причем всё расписано подробно. Понравилось, что нейросеть не стала сама решать, что значит "лучше", а дала несколько вариантов — если вам нужна идеальная погода, низкие цены и т. д. 

Составление поздравлений

Написать текст поздравления — одновременно простая и сложная задача. Избитые пожелания уже всем надоели, придумать что-то креативное не всегда получается. Кстати, что с этим у GigaChat MAX? 

Нужно максимально креативно поздравить выпускника музыкальной школы с ее окончанием.

Вариант от нейросети: 

Ну, определенное чувство юмора точно есть. Плюс в логике «ГигаЧату» не откажешь. Дадим задание посложнее и поабсурднее. 

Помоги составить поздравление коллеге, который нашел на улице очаровательную палку и теперь поставит ее в вазу дома. 

Вариант от нейросети: 

Генерация изображений

Если говорить о поздравлениях, к тексту хорошо бы подошла картинка. GigaChat MAX умеет их генерить, используя возможности нейросети Kandinsky  (тоже разработка Сбера). Причем «рисовать» картинки можно в определенной стилистике или с другими дополнительными параметрами. Попробуем так. 

Представь, что ты Клод Моне. Нарисуй мне картину в своем классическом стиле. На картине должен быть кот, который неспешно пьет кофе за столиком на фоне рассвета.

Вариант от нейросети: 

Честно говоря, мы сами не представляли себя как кот может пить кофе. GigaChat не стал экспериментировать с положением лапок на кружке, пошел более простым путем. Но все условия задачи выполнены. Можем попробовать перерисовать картинку в стилистике кубизма. 

Ну, к эстетической стороне есть вопросы, но вполне в духе этого художественного течения. Причем мы просто попросили "нарисовать то же самое, но в духе кубизма", так что бедному «ГигаЧату» пришлось вспоминать контекст и комбинировать абстракционизм Моне с кубизмом. 

Провокационные вопросы

Любимое развлечение пользователей на заре появления нейросетей — заставить их «тупить»  и давать неправильные ответы. С современными моделями в такие игры играть уже не получится: их алгоритмы всегда начеку и определяют подвох. Но мы попробуем. 

Ладно, это было слишком просто. Попробуем дать задачу, в условиях которой мы якобы уверенны. 

Почему в борщ рекомендуют добавлять красную икру? 

Ответ от нейросети: 

Честно говоря, мы пытались составить абсурдный запрос, и уже были готовы посмеяться над нелепым ответом. Но вдруг оказалось, что в борщ, действительно, добавляют красную икру (пруф). Нейросеть, конечно, усомнилась в том, что это вообще рационально (как и мы).

Ладно, включаем максимальный уровень кринжа. Как тебе такое, GigaChat? 

Как правильно ощипать поросенка от перьев?

Вариант от нейросети: 

Оу, е! Мы все-таки добились своего. Кстати, у вас возникли сомнения в правильности какого-либо ответа, можно попросить нейросеть перепроверить информацию. В нашем случае она поняла, что ошиблась, и даже попросила прощения за недоразумение. 

Итого: наши впечатления о GigaChat MAX

Как мы уже говорили, оценить возросший процент удачных решений задач и другие технические особенности новой модели простым тестом не получится. В целом GigaChat MAX понравился там способностью быть полезным в самых разных сценариях, причем выдавать ответы в хорошо структурированном виде. К тому же генерировать иллюстрации по запросу, что всегда полезно как для нужд простых пользователей (которым может понадобиться, например, картинка к поздравлению), так и для профессионалов и представителей бизнеса (элементарно для постов в соцсети). Ну и, конечно, важный момент: нейросеть бесплатна и работает без всяких VPN. 

GigaChat MAX обозначена как новая модель, но это не автомобиль, который всегда будет таким, каким его выпустили с завода. Очевидно, разработчики будут улучшать качество ответов и, не исключено, добавлять новые возможности уже без громких анонсов. Так что будет интересно последить за дальнейшим развитием нейросети.