Обзор Гигачат - Включи нейросеть от Сбера и пользуйся уже сейчас

  1. И пишет, и рисует: что умеет нейросеть GigaChat
  2. Архитектура: нейросетевой ансамбль NeONKA
  3. Регистрация – и поехали: тест-драйв GigaChat

    Что такое промт
    Работа с текстом
    Рисуем картинки
    Примеры промтов
  4. Почти готово: от бета-версии – к релизу

В сфере IT царит гегемония зарубежных компаний, а ведь недавно советские разработчики успешно конкурировали с западными. Взять, к примеру, «Тетрис». Самую популярную игру в мире придумал отечественный программист. А что сегодня?

Петербургские разработчики презентовали язык программирования Kotlin, который Google назвала приоритетным. Российский стартап FaceApp знают, кажется, все. А компания Сбер анонсировала свой GigaChat – нейросеть, которая собирается конкурировать с ChatGPT.

И пишет, и рисует: что умеет нейросеть GigaChat

Новую нейросеть GigaChat компания Сбер презентовала в апреле 2023 года. Сервис доступен в режиме «beta». Ссылки для доступа раздают в Telegram. Пока разработчики проводят тестирование и отладку программного обеспечения, мы изучили актуальные опции Гигачат.

GigaChat – мультимодальная нейронная сеть. Это значит, сервис способен выполнить не одну, а много разных задач. В числе актуальных на момент обзора:

  • поиск информации в интернете на манер Google и Яндекс;
  • написание информационных и коммерческих текстов;
  • ответы на вопросы пользователя и ведение диалога;
  • генерирование и редактирование изображений;
  • помощь в изучении языков программирования.

Нейросеть называют российским аналогом ChatGPT, но в сравнении с конкурентом GigaChat, кажется, его обходит. Во-первых, ChatGPT даже в своей «сенсационной» четвертой версии не умеет рисовать картинки. Отвечает GPT-4 только текстом, а GigaChat можно попросить что-нибудь нарисовать. И тут мы вплотную подходим к программному обеспечению, которое все это обслуживает.


Архитектура: нейросетевой ансамбль NeONKA

В основе мультимодальной нейросети – модель NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Состоит из модулей RuGPT-3.5, FRED-T5, RuCLIP и Kandinsky 2.1. Именно этот «нейросетевой ансамбль» позволяет сервису генерировать тексты, коды и рисунки. 

Про RuGPT-3.5 все примерно понятно. Это русскоязычный аналог GPT-3.5 от Open AI, который тоже работает с текстами – пишет, анализирует, редактирует, резюмирует, переводит. Может поддержать неформальный разговор – «поболтать» о природе, погоде или политике.

О модуле FRED-T5 (Full-scale Russian Enhanced Denoisers T5) многие слышат впервые. Но именно FRED лучше всех в мире понимает русский язык. По итогам тестирования языковая модель уступает лишь человеку. Собственно, до него ни одна русскоязычная нейросеть не могла похвастаться таким глубоким пониманием специфики языка.

RuCLIP – модель, которая обеспечивает получение семантически близких картинок и текстов. От оригинальной англоязычной модели отличается хорошим пониманием русского. Как и две предыдущие, эта тоже продукт экосистемы компании Сбер. 

Что касается Kandinsky 2.1, эту нейросеть для генерации изображений не обсудил только ленивый. Одни эксперты утверждают, что Кандинский поставил шах и мат самой Midjourney. Другие не так оптимистичны в оценках. Но преимуществ у Кандинского много – от 20 вариантов стилей до функции создания картины в режиме бесконечного полотна. Из минусов – разрешение 768×768 пикселей. Понятно, что мало.

Вот такой программной начинкой оснастила компания Сбер мультимодальную нейросеть Giga Chat. А что из этого вышло, будем сейчас тестировать. 

Регистрация – и поехали: тест-драйв GigaChat

Доступ к нейросети – по приглашению в Telegram. На канал GigaChat подписано почти 240 тысяч, а ссылки раздают не всем. По 5-10 тысяч приглашений разово, но регулярно. Кто успел – тот получил. Не с первого, так с десятого раза можно попасть. Из последних новостей – со дня на день GigaChat смогут использовать все подписчики канала. Пока бесплатно.

Регистрацию можно пройти прямо сейчас. Перейдите по ссылке и нажмите «Зарегистрироваться» в правом верхнем углу. Если есть аккаунт в Google, можно войти через него. Вот ссылка: https://developers.sber.ru/por...

GigaChat

По рекомендации чат-бота откроем гайд, на странице которого нас сразу предупредили, что сильной стороной GigaChat являются творческие задачи – например, рекламный текст или письмо о любви. А с точными ответами пока не очень. Насколько не очень, сейчас проверим.

Что такое промт

В работе с нейросетями главное – правильно сформулировать запрос. И хотя алгоритмы принято называть «умными», обращаться с ними нужно, как с маленькими детьми – давать подробные и четкие вводные данные. В мире нейросетей их называют запросами или промтами. Промтом может быть вопрос, инструкция, задача. Если хотите – приказ. В промте можно описать контекст, задать роли, привести примеры. Все это повышает эффективность запроса и, соответственно, результативность того, что выдаст чат-бот.

Работа с текстом

Начнем с простого. Зададим нейронной сети несложный вопрос о главных достопримечательностях Санкт-Петербурга.

GigaChat

GigaChat назвал Эрмитаж, Петропавловскую крепость, Зимний дворец, Храм Спаса на Крови и Петергоф. С задачей справился. Усложним. Предложим чат-боту проанализировать фрагмент текста и сделать короткое резюме.

GigaChat

А теперь поиграем с ролями. Попросим GigaChat представить себя в роли врача-психиатра и ответить с учетом этого на вопрос – что делать, если в голове раздаются голоса.

чат-бот

Каждый ответ нейросети можно оценивать с помощью кнопок «Палец вверх» и «Палец вниз», расположенных слева внизу. Разработчики говорят, этим мы сильно помогаем сделать программу более совершенной. Справа внизу – кнопки «Обновить» (для генерации альтернативного ответа) и «Редактировать» (для внесения правок). 
Чат-бот можно попросить написать письмо. Надо лишь указать, кто адресат и о чем в письме должно говориться. Если нужно – добавить детали. Для примера сгенерируем шуточное письмо с запросом чат-боту «Напиши письмо моему коту о том, что я его люблю. Попроси, чтобы он не мешал мне, когда я работаю. Скажи, что я зарабатываю ему на вкусные консервы».

Giga Chat

Гигачат может генерировать полезные списки. Например, релевантно предложит 5 простых, но оригинальных закусок, которые можно быстро приготовить гостям. 

Гигачат

И тут же, если спросить, даст вменяемые рецепты со списком ингредиентов и пошаговыми инструкциями.

нейросеть

Сказки и песни, доклады и рефераты, рерайт и копирайтинг – собственно, все, что лежит в плоскости текстов, можно создать при помощи GigaChat. Речь не идет о генерации «под ключ». С полученным материалом нужно дальше работать. Но это не проблема Гигачат, а особенность работы любой нейросети – уступать в качестве человеку. А как дела с картинками?

Рисуем картинки

В разговоре о нейросетях, рисующих картинки, на слуху только Midjourney. В GigaChat интегрирован не менее любопытный программный продукт – наш Кандинский 2.1. В отличие от Midjourney, доступ к которой осуществляется через Discord, а в работе нужно использовать «слэши», Кандинский работает просто. Пишешь текст – получаешь картинку. Мы захотели «кота в мешке». 

Кандинский 2.1

Чтобы объединить пару объектов или предметов в один, используйте дефис. Мы заказали «зайца-кота». Что хотели, то и получили.

Промт зайца-кота

Промты для генерации картинок должны быть точными, подробными. Нейросеть отлично работает с запросами вроде «закат, лес, медведь, берлога» и чуть хуже понимает, что такое «медведь, любующийся закатом на опушке дремучего леса». Разработчики призывают не злоупотреблять причастными и деепричастными оборотами. 
Собственно, для генерации картинки достаточно одного-двух слов, но в этом случае все детали нейронная сеть додумает за вас сама. А если хочется управлять процессом полностью, и случайное стечение обстоятельств вам не подходит, тогда все придется прописывать.

Промт-инжиниринг

Примеры промтов

Промт-инжиниринг называют профессией будущего. Мы уже понимаем, что без нейросетей никуда, а значит стоит уже сегодня присмотреться внимательно к такому навыку, как составление промтов. От формулировки запроса зависит слишком многое, а именно – результат. И вот несколько шаблонов, которые попадают прямо в нужную цель.

SEO-специалисты и маркетологи при работе с Гигачат могут использовать промты «Составь 5 SEO-оптимизированных названий для поста в блоге о…», «Какие самые популярные фразы люди используют для поиска…в Google?», «Напиши 10 креативных слоганов для…».

Блогерам будут полезны промты «Дай мне 5 идей для постов на тему…», «Напиши короткий пост (до 1000 символов) про…», «Предложи идеи, как улучшить блог о…». И абсолютно каждому пригодятся запросы «Нарисуй», «Переведи», «Посоветуй», «Как приготовить».

Почти готово: от бета-версии – к релизу

Говорят, что навыки (модули) будут еще добавляться. Не исключено, что в будущем GigaChat будет работать со звуком и видео. Но то, что мы видим сейчас, уже вызывает чувство глубокого удовлетворения. Beta-версия – не «сырая», а почти готовый продукт. Этим можно пользоваться, а результаты генерации радуют. Ничего подобного в области мультимодальных сетей в русскоязычном сегменте не было. И будет правильно при первой возможности начать использовать GigaChat и в процессе давать обратную связь разработчикам. Каждый маленький вклад имеет большое значение. Любое усилие приближает нас к цели. Наша поддержка и активное участие в it-процессах ускоряет развитие этой отрасли. Поэтому – вперед навстречу инновациям.

Реклама. Информация о рекламодателях по ссылкам в карточках на странице.