Говорящая утварь. На Conversations обсуждали возможности диалоговых технологии ИИ

Похоже, следующим форм-фактором интеллектуальных устройств становятся «умные» колонки – их рынок сейчас стремительно развивается и растет. По оценкам IHS Markit, в 2017 г. в мире их было продано 34,7 млн, в 2018 г. – 78 млн, а в 2022 г. будет продано уже 200 млн  общей стоимостью 32 млрд долл. В России, по данным компании Just AI, в 2018 г. было продано 40 тыс. аналогичных устройств,  по результатам текущего года ожидается продажа 320 тыс. Основная часть «умных» колонок, продаваемых в России, это «Яндекс.Станция». В следующем году планируется выпуск на российский рынок еще четырех устройств разных производителей. На 2021 г. Just AI прогнозирует продажу в России 4,5 млн устройств класса «умных» колонок, а всего у клиентов будет установлено около 6 млн колонок.

Такие устройства относятся к классу голосовых помощников, которые сегодня активно используются в мобильных платформах – это «Алиса» («Яндекс»), Siri (Apple), Google Assistant (Google), Cortana (Microsoft). При этом именно на смартфонах голосовых помощников установлено на порядок больше, чем в специализированных устройствах. По результатам опроса, проведенного компанией Just AI, до 90% помощников установлено на смартфонах, 4% – в навигаторах, 3% – в «умных» колонках, 2% – на компьютерах и всего 1% – в «умных» часах. Российские пользователи предпочитают пользоваться именно «Алисой» – она оказалась популярной у 77% российских пользователей,  Siri и Google Assistant набрали существенно меньше поклонников – 16% и 13% соответственно.

Впрочем, по словам Бена Стентона, главного аналитика компании Canalys, основной рынок развития «умных» говорящих устройств – Китай, где количество пользователей уже достигает 35 млн человек, в то время как в США их 18,7 млн, а во всем остальном мире 22,7 млн. Таким образом, Китай является сейчас законодателем мод в «умных» устройствах – на этом рынке есть уже несколько достаточно сильных брендов, например,  Baidu c 11,7 млн пользователей, Tmall – 11,2 млн клиентов и Xiaomi – 9,4 млн потребителей. Причем 80,2% всех «умных» колонок пока не имеют дисплея, но именно в Китае начинают появляться такие устройства, как «умные» экраны, которые снабжены дополнительным экраном для отображения информации.

Все устройства основаны на двух технологиях из класса искусственного интеллекта – распознавание и синтез речи и обработка естественного языка. Правда, обе задачи решаются не локально, на самом «умном» устройстве, а в облаке производителя системы распознавания. Однако «Алиса», Siri и Google Assistant способны обрабатывать только определенные домены знаний,  предоставляя возможность сторонним разработчикам создавать приложения для работы с «умными» колонками и другими голосовыми помощниками. Таким образом, каждый производитель создает вокруг своего продукта целую экосистему разработчиков голосовых приложений.

Сейчас «умные» колонки используют в основном дома в качестве развлечения, хотя появляются сценарии применения таких устройств и в корпоративном секторе. В частности, сеть гостиниц Marriott экспериментирует с ними при обслуживании гостей. Аналогичное применение такие устройства находят в медицине. Главная проблема пр корпоративном использовании – отсутствие приложений, позволяющих интегрировать голосовые приложения с корпоративными информационными системами, но  промышленные платформы для разработки подобных приложений уже начинают появляться. Потребность в голосовом взаимодействии существует во множестве профессий, где необходимо обрабатывать большие массивы информации, а у пользователя  руки заняты (водители, пилоты, инженеры технического обслуживания и др.).

Для применения диалоговых технологий, например, в «умных» касках, предлагается использовать не только голос специалиста, но и информацию о его местоположении и направлении его взгляда. В наушники или сами каски можно вмонтировать дополнительные датчики определения положения головы, на основе показаний которых можно будет определять направление взгляда человека и формировать диалог с учетом этой информации. Обзор различных интеллектуальных мобильных помощников привел на конференции Игорь Михненко, сооснователь и главный дизайнер дизайн-хауса NotAnotherOne. Он отметил, что одной из компаний, которая активно занимается разработкой мобильного оборудования для корпоративного применения, в частности, диалоговых технологий, является RealWear.

Впрочем, в настоящее время основным направлением корпоративного использования диалоговых технологий является обслуживание клиентов с помощью различных каналов взаимодействия: по электронной почте, с помощью мессенджеров, чат-ботов и даже голоса. Голосовые роботы вполне могут заменить операторов центров обработки телефонных вызовов на рутинных операциях, где и живые люди часто ведут себя как роботы – действуют по строго определенной программе и не стараются даже минимально проявлять эмоции. Технологии распознавания и генерации речи продвинулись уже достаточно далеко, чтобы полностью автоматизировать работу первой линии телефонных операторов, давая специалистам возможность сконцентрироваться на сложных случаях. Со временем первая линия вообще может быть перенесена на сторону клиента в  «умное» голосовое устройство.

Валерий Коржов

 

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку