Нейросеть Сбера осваивает великий и мугучий

Сбер продолжает развивать русскоязычную нейросеть ruGPT-3, которая уже способна генерировать очень сложные осмысленные тексты всего лишь по одному запросу на «человеческом» языке. С момента презентации нейросети на AI Journey 2020 количество ее параметров выросло почти вдвое – с 760 млн до 1,3 млрд. Это огромный шаг вперед в обработке естественного языка методами искусственного интеллекта в России.

Языковая модель GPT-3

Напомним, что GPT-3 (Generative Pre-trained Transformer) – крупнейшая языковая модель в мире, разработанная компанией OpenAI для решения любых задач на английском языке. На русском языке, более сложном с точки зрения его структуры, до появления системы ruGPT-3 аналогичных качественных моделей просто не существовало.

Отечественная GPT-3 постоянно обучается на суперкомпьютере Сбера «Кристофари» на гигантском массиве данных, так что ее возможности растут с каждым днем.

RuGPT-3 может не только создавать тексты любого профиля (новости, романы, стихи, пародии, техническую документацию и так далее), но также исправлять грамматические ошибки, вести диалоги и писать программный код. По сути дела, это прообраз «общего», или так называемого «сильного», искусственного интеллекта AGI (Artificial General Intelligence), способного уже сегодня решать разноплановые задачи в различных сферах человеческой деятельности.

Конференция AI Journey

Александр Ведяхин, первый заместитель председателя Правления Сбербанка, сообщил, что на международной конференции AI Journey в декабре 2020 года представители Сбера продемонстрировали ruGPT-3 и анонсировали дальнейшее наращивание ее возможностей. Совместно с командой из SberDevices специалисты Сбера выполняют это обещание и уже довели число параметров нейросети с 760 млн до 1,3 млрд. Этот количественный рост означает качественное улучшение «интеллекта» системы, ее способности решать новые задачи на уровне, сопоставимом с человеческим, или выше него.

Однако вычислительные мощности суперкомпьютера Сбера «Кристофари» позволяют специалистам ставить еще более амбициозные цели, так что 1,3 млрд параметров – это только начало.

Место в рейтинге нейросетей

Сеть ruGPT-3 XL на 1,3 млрд параметров на данный момент занимает первое место в лидерборде (рейтинге) нейросетей Russian SuperGLUE. С помощью метода few-shot данная модель без какого-либо обучения лучше всех выполнила следующие задачи:

  • выбор лучшего решения в заданных условиях (+10% точности по сравнению с предыдущей версией на 760 млн параметров);
  • ответы на вопросы по тексту (+3% точности);
  • машинное чтение (тест на понимание общего смысла текста) (+32% точности).

Лидерборд Russian SuperGLUE – это первый рейтинг нейросетей для русского языка. Место в этом рейтинге зависит от того, насколько качественно та или иная нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Лидерборд был разработан командой AGI NLP (Artificial General Intelligence Natural Language Processing). Это открытый проект, которым пользуются все исследователи данных, работающие с русскоязычными нейросетями.

Результаты данного рейтинга публикуются на сайте https://russiansuperglue.com/ru/.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку