Охота на цифровые следы

Департамент информационных технологий Москвы заказал апгрейд платформы анализа поведения интернет-пользователей. Новым функционалом планируется оснастить информационную систему мониторинга и анализа интернет-активности (СТАТС), запущенную в 2017 г. Первоначально она была предназначена для анализа поведения посетителей онлайн-порталов и сервисов правительства Москвы.

Что сможет обновленная СТАТС?

После доработки, которую компания «Программный продукт» выполнит за 276 млн руб., система сможет собирать данные о том, что пользователь делал и на других ресурсах.

Согласно документам госзакупки в системе появятся модули для загрузки геоданных, загрузки обезличенных данных об оплате услуг и штрафов, данных WiFi-сессий в общественном транспорте, сведения о нарушениях медицинских ограничений, данные о проездных документах.

Наряду с этим система сможет анализировать показатели лояльности и участия в событиях. Инструменты помогут «оперативно выявлять возникающие тренды» и «формировать целевые показатели активности пользователей», указано в документах. В систему будут загружены данные «из информационных систем правительства Москвы и других источников».

Сроки контрактов

Тендер на доработку СТАТС объявлен осенью 2020 года, поставщик был определен месяц назад. По условиям контракта, работы должны быть завершены до 31 октября 2022 года.

Помимо этого контракта «Программный продукт» получил в феврале от ДИТ и подведомственного ему «Инфогорода» еще два контракта на общую сумму в 730 млн руб. Один из них предусматривает развитие информационной системы развития предпринимательства и промышленности (ИС РПП) за 602 млн руб., а другой – доработку информационной системы управления данными в распределенной вычислительной среде (ИС УДРВС) за 132 млн, сообщили «Ведомости».

Все данные о пользователе в системе

Анализ поведения пользователей позволяет повысить качество и удобство предлагаемых сервисов. В ДИТ заверили, что данные будут храниться в обезличенном формате: «Профиль и персональные рекомендации формируются не для конкретного человека, а для устройства. Система работает без привязки к персональным данным пользователя и не посягает на тайну его личной жизни».

Основная задача системы – повысить удобство и качество предоставляемых сервисов на основе данных об их использовании, полученных с различных устройств – смартфонов, планшетов и других гаджетов, отмечают в ведомстве.

Для анализа интернет-активности в рамках работы СТАТС важен сам факт обращения пользовательского устройства к тому или иному сервису, баннеру или другому элементу сайта, а не конкретная информация, указанная при использовании сервиса. По словам представителя ДИТ, сопоставлять с другими данными полученную информация не планируется: «Анализ интересов пользователей по-прежнему будет проводиться исходя из их активности на городских интернет-ресурсах».

Однако, как следует из техзадания к апгрейду СТАТС, «модуль формирования персонализированного контента должен обеспечивать формирование витрин данных интересов интернет-посетителей по результатам аналитики посещаемых пользователями ресурсов правительства Москвы и других источников данных, а также сервис предоставления сформированного контента внешним потребителям».

Кроме того, в техзадании говорится о возможности выявления уникального интернет-посетителя «без использования cookies для увеличения точности сопоставления профилей». Файлы cookies позволяют системе узнать, чем интересовался пользователь на том или ином сайте в том случае, если эти файлы на разных сайтах синхронизированы, объяснил «Ведомостям» принцип работы системы человек, близкий к ДИТ. Для того чтобы у системы СТАТС появился доступ к такой аналитике, в программный код сайта нужно добавить одну строчку кода, подтвердил другой бывший сотрудник ДИТ. Вместо cookies идентификатором, позволяющим проследить цифровой след пользователя, может служить номер телефона, говорит он. Под обезличенностью ДИТ понимает идентификаторы, которые хранятся в системе, однако при необходимости, по запросу правоохранительных органов, например, идентификаторы из разных систем и ресурсов могут быть связаны и деобезличены, утверждает эксперт, знакомый с функционалом системы.

Чем больше данных, тем выше риски

Современные технологии позволяют с большой точностью установить конкретного человека по набору таких данных, утверждает старший юрист Digital Rights Center, эксперт «Роскомсвободы» Владимир Ожерельев: «Даже если данные будут собираться в обезличенном виде, это не исключает возможности их соотнесения с другой информацией, что в совокупности позволит идентифицировать конкретного человека, к которому эти данные относятся. Реализация возможности выявления уникального интернет-посетителя косвенно подтверждает, что все данные в совокупности либо изначально не будут обезличенными, либо будут иметь предпосылки стать таковыми».

Данные, которые ДИТ хочет агрегировать в одной системе, избыточны для заявленных целей по персонализации контента на сайтах правительства Москвы, считает бизнес-консультант по безопасности Cisco Systems Алексей Лукацкий: «Чем больше данных, тем выше риски: у ДИТа неоднократно случались утечки данных, например, о заболевших коронавирусом, а в СТАТС планируется хранить цифровой профиль клиента с информацией из самых разных систем».

Проблема требует решения

Последние громкие случаи утечки данных из ДИТ (независимо от того, был взлом системы или произошло это по вине сотрудников, как в случае с данными о переболевших коронавирусной инфекцией) заставляют настороженно относиться к любым попыткам ведомства аккумулировать данные.

Если ДИТ интересует интернет-активность москвичей и при этом надежность хранения данных дает сбои, самое время не только признать наличие проблемы (как это делали в ДИТ), но и принять адекватные меры.

https://www.mos.ru/dit/

https://www.vedomosti.ru/

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку