Машинное обучение для «чайников»

25 сентября в Москве «Открытые Технологии» представили свой новый продукт – «ОТ.Платформу».

В презентации новой платформы приняли участие: президент компании «Открытые Технологии» Сергей Калин; генеральный директор Олег Гизатуллин; директор Центра компетенций компании Павел Волков и член рабочей группы «НейроНет» Владимир Статут. В качестве модератора мероприятия выступила академический руководитель образовательной программы «Журналистика данных» НИУ ВШЭ Тина Бережная.

Спикеры представили первую в России открытую универсальную платформу для решения задач методами машинного обучения без необходимости привлечения специалистов по ML. С ее помощью простота применения методов машинного обучения и искусственного интеллекта (ИИ) будет доступна каждому пользователю без дополнительных технических знаний в области программирования – благодаря описательному языку анализа данных OT.SML. «ОТ.Платформа» сможет применяться для оцифровки экспертного опыта и знаний в самых разных областях человеческой деятельности: в ТЭК, ритейле, медицине, образовании, промышленности, безопасности, транспорте. В ходе мероприятия член рабочей группы «НейроНет» Владимир Статут представил создаваемую на базе нового программного продукта отраслевую платформу ATLAS, которая с помощью методов искусственного интеллекта способна накапливать и анализировать информацию о сценариях технических сбоев и предотвращать их повторение.

Президент «Открытых Технологий» Сергей Калин коротко напомнил историю создания и развития компании, которая была основана в 1994 году. Как отметил президент ОС, в первые годы своего существования компания ориентировалась на Unix-системы, а штат организации ограничивался 50 сотрудниками.

В 2000-е годы «Открытые Технологии» активно занимались внедрением ERP-систем на базе Oracle, а наиболее значимым проектом, оказавшим в то время определяющее влияние на развитие компании, стала совместная работа с холдингом «Связьинвест», который в то время включал в себя более 80 региональных компаний.

В 2008 году, после экономического кризиса, руководство «Открытых Технологий» произвело коренную перестройку компании, включая сокращение штата сотрудников и другие реформы. Затем российский системный интегратор с новой энергией и стратегией включился в работу и занял достойное место на рынке ИТ.

Генеральный директор Олег Гизатуллин отметил, что сейчас штат сотрудников компании насчитывает около 500 человек. «Открытые Технологии» могут похвастаться наличием примерно 5000 заказчиков и 55 000 завершенных проектов. Ежегодный рост компании составляет 23%, а оборот в 2018 году достиг цифры в 7 млрд. руб.

«Открытые Технологии» приняли активное участие в обеспечении безопасности ЧМ-2018 и Кубка Конфедерации 2017 года. Комплексная система, созданная компанией «Открытые Технологии», обеспечивала работу 71 объекта и вещательного центра в «Kpoкyc Сити», в котором функционировали 15 систем для журналистов и других работников СМИ.

Олег Гизатуллин также рассказал о построении корпоративной сети передачи данных в ПАО «Группа «Черкизово», которая была создана в короткие сроки – за 8 месяцев. Затем «Открытые Технологии» стали победителем тендера на создание единой системы оперативно-технологического управления объектами электросетевого хозяйства АО «Янтарьэнерго» с модернизацией диспетчерских пунктов в Центре управления сетями и филиалах АО «Янтарьэнерго»: «Западные ЭС», «Городские ЭС» и «Восточные ЭС».

Генеральный директор компании также остановился на особенностях внедрения услуги мониторинга информационных систем для ДИТ правительства Москвы и миграции информационной системы «Гринатома» (ИТ-дочки «Росатома») на метрокластер, а завершил свое выступление описанием создания системы контроля за обращением алкогольной и табачной продукции с использованием акцизных марок для «Гознака».

Директор Центра компетенций компании Павел Волков отметил, что у «Открытых Технологий» накопился большой опыт в области работы с большими данными и искусственным интеллектом, а также в сфере выполнения совместных проектов по цифровизации крупных российских предприятий. Перейдя к технологии машинного обучения, он указал на то, что сегодня у заказчиков зачастую имеется некий элемент превышения ожиданий на волне хайпа: «Им порой кажется, что дата-сайентист может каким-то волшебным образом создать систему на базе машинного обучения, пригодную для использования на предприятии, без обращения к опыту конкретной области. А на практике необходимо хорошо разбираться в предметной области, чтобы получить отдачу от использования технологии машинного обучения». Павел Волков также подчеркнул, что для заказчика, не имеющего представления о языках программирования ML, технология оказывается неким «черным ящиком», поэтому на рынке сегодня царит «дикий запад»: «Получает контракт тот, кто умеет громче кричать». В результате заказчик оказывается в ситуации, когда он просто не в состоянии верифицировать результаты работы системы.

Директор Центра компетенций компании также посетовал на то, что заказчики зачастую занимаются изобретением велосипеда», в то время как «Открытые Технологии» могут предложить универсальное решение, в качестве которого и выступает «ОТ.Платформа». Она позволяет «дать голос отраслевым экспертам без погружения в сложные языки программирования ML». Язык OT.SML предоставляет экспертам инструментарий не на абстрактном уровне, а на уровне логических конструкций, поэтому они могут опустить рутинные операции программирования, остающиеся «под капотом» ML. Эксперт просто создает тестовый алгоритм, строит объектную модель процесса, т.е. описывает задачу в терминах логики, а уже затем дата-сайентист пишет «боевую систему».

Павел Волков особо подчеркнул тот факт, что «Открытые Технологии» приняли беспрецедентное решение – делать платформу на Open Source. Такой подход позволит дать бизнесу возможность зарабатывать на внедрении AI и ML и подстегнет развитие новых технологий в различных отраслях.

В качестве проблемного момента директор Центра компетенций указал на особенности госрегулирования и заявил о том, что нам необходимо менять законодательную базу. Пока же практика регулирования в России блокирует инновационные начинания и не позволяет использовать в работе предприятий результаты цифрового моделирования сложных объектов и процессов.

Член рабочей группы «НейроНет» Владимир Статут рассказал о том, как с помощью отраслевой платформы Atlas неквалифицированные в области нейросетей отраслевые эксперты могут создавать работоспособные ML-решения. При этом специалисты из различных отраслей экономики получают уникальную возможность передавать свой десятилетиями наработанный опыт в систему, повышая возможности машинного интеллекта.

Владимир Статут также подчеркнул, что платформа Atlas фактически является системой коллективной безопасности: эксперты из различных отраслей передают в платформу свой опыт по аварийным ситуациям. Соответственно, чем дольше работает эта система, и чем больший опыт она накапливает, чем больше количество участников проекта, тем выше вероятность того, что очередной участник не встанет на грабли, не совершит ошибок, которые сделали другие.

Описывая уровень сложности языка системы, создатели платформы заявили о том, что отраслевой эксперт в состоянии полноценно овладеть им в течении нескольких дней.

Академический руководитель образовательной программы «Журналистика данных» НИУ ВШЭ Тина Бережная рассказала о конкретных примерах использования возможностей искусственного интеллекта в секторе масс-медиа.

В частности, она сослалась на использование AI-решения агентством Associated Press, которое позволяет использовать шаблоны с пропусками для ввода актуальных данных и ключевых слов и может генерировать тексты, написанные «человеческим» языком.

Достаточно далеко продвинулось в использовании технологий ИИ британское агентство BBC, например, там ML используется для составления отчетов о выборах. Искусственный интеллект обеспечивает скорость, низкую стоимость, обучаемость и масштабируемость (возможно использование любого количества первоисточников).

Агентство Reuters совместно с Alibaba использует ИИ под названием News Tracer для отбора новостей через Twitter и проверки их подлинности.

Роботы учатся работать не только с текстовой информацией – уже появились первые системы автоматического видеомонтажа.

Конечно, пока еще есть масса нерешенных задач: поиск и проверка первоисточника, проверка качества данных, связка аудио, видео и текста, автоматизация VR/AR. Роботы не умеют считывать культурный и социальный контекст, у них нет эмоционального опыта, они пока еще не способны воспроизводить естественный человеческий язык, не умеют понимать неструктурированные данные и делать из них верные выводы.

Тем не менее, как считает Тина Бережная, все это лишь вопрос нескольких лет развития, в течение которого технология ИИ решит все перечисленные задачи в секторе СМИ.

В ходе сессии вопросов-ответов из зала поступило предложение организовать вебинар по языку программирования на «ОТ.Платформе»: представители «Открытых Технологий» и Владимир Статут с энтузиазмом отнеслись к этому предложению и пообещали решить этот вопрос в самом ближайшем времени.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку