Медицинские задачи для ИИ

Сеченовский университет, Yandex Cloud и Beltel Datanomics создали облачную платформу медицинских данных для изучения с помощью ИИ новых методик лечения.

Источник ИИ-сервисов

Специалисты Сеченовского университета, Yandex Cloud и Beltel Datanomics завершили создание первой в России платформы медицинских данных. На платформу загружены 18 млн уникальных медицинских документов. Решение поможет исследователям, врачам, студентам и аспирантам Сеченовского университета Минздрава РФ проводить научные исследования, оценивать эффективность методов лечения на разных группах пациентов, а ИТ-командам – создавать сервисы искусственного интеллекта в области здравоохранения.

Специалисты смогут за считаные секунды собирать наборы “живых” клинических данных с возможностью фильтрации по 150 параметрам: полу, возрасту, симптомам пациентов и другим характеристикам.

Интерфейс и поисковый алгоритм

Платформа представляет собой веб-интерфейс с поисковыми ячейками, в котором можно искать документы и наборы данных по ключевым словам, а также применять различные фильтры. К примеру, можно найти все зафиксированные случаи сахарного диабета у людей в возрасте от 20 до 50 лет, собрать примеры пациентов с повышенным креатинином в заданном диапазоне значений, сделать выгрузку всех известных орфанных заболеваний, и многое другое. Система автоматически отбирает релевантные документы со ссылками на рентгеновские снимки, результаты лабораторных анализов, КТ, МРТ и других исследований. Данные можно сохранить, выгрузить в табличном виде и использовать для разработки ИИ.

В 2024 году доступ к платформе получат более 1000 специалистов – сотрудников университета. В планах организации – постепенно подключать новые источники данных, настроить визуализацию данных с помощью технологии DataLens и добавить возможность работать с запросами на естественном языке, используя генеративную нейросеть YandexGPT.

Поиск за считаные минуты

«Благодаря данной платформе мы сможем на несколько порядков быстрее собирать данные для научной деятельности, образовательной работы, написания статей. То, на что раньше уходили месяцы кропотливой работы в архивах, теперь можно сделать меньше, чем за минуту, если задать правильные параметры поиска. Мы рассчитываем, что в будущем другие медицинские организации смогут подключаться к платформе, чтобы обмениваться данными и делать научные открытия. Мы также готовы делиться дата-сетами с научным сообществом и разработчиками сервисов искусственного интеллекта, в том числе на коммерческой основе», – рассказал Константин Бражников, заместитель директора департамента развития клинических и образовательных проектов Первого МГМУ им. И.М. Сеченова Минздрава РФ.

Уникальная структура данных

«Это знаковый проект в российском здравоохранении, с уникальной структурой данных. Это первая в России мультиформатная платформа, с возможностью искать в едином окне тексты медицинских заключений, результаты КТ, МРТ, рентгеновские снимки, результаты лабораторных анализов и многие другие данные, необходимые для работы медицинских специалистов. Обработаны более 18 миллионов медицинских документов. Это большие объемы данных, которые упорядочили и привели в единый формат, чтобы обеспечить возможность полнотекстового поиска. Ещё одной задачей было организовать постоянное обновление данных, в чем, конечно, помогла облачная архитектура решения», – отметила Анна Лемякина, директор по национальным стратегическим проектам Yandex Cloud.

Проектная команда

«С самого начала мы увидели высокую вовлеченность команды Сеченовского университета, ощутили востребованность и потенциальную полезность аналитической платформы для медицинского учреждения. Безусловно, это помогло выполнить проект в достаточно сжатые сроки – девять этапов, начиная с разработки макета веб-портала до запуска платформы, были реализованы фактически за семь месяцев. В команду с нашей стороны вошли все необходимые специалисты – бэкенд и фронтенд разработчики, дата-инженеры, облачные архитекторы, дизайнер и технический писатель, но также помогло наличие сетевой и ИБ-экспертизы у системного интегратора «Белтел», частью которого является подразделение Beltel Datanomics. Мы также благодарны компании «Первый Бит» за помощь в проектировании системы выгрузки первичных данных из МИС 1С. Уверена, что созданная аналитическая платформа ещё больше усилит научный потенциал Сеченовского университета», – подчеркнула Анна Племяшова, директор Beltel Datanomics.

Десять сервисов Yandex Cloud

Решение разработала и внедрила компания Beltel Datanomics, эксперт в области аналитики Big Data и искусственного интеллекта. Платформа университета использует более десять сервисов Yandex Cloud: виртуальные машины развернуты с помощью Compute Cloud. Пока данных не так много, хранилище данных построено на управляемом сервисе Managed PostgreSQL, по мере роста нагрузки возможна миграция на Managed Service for Greenplum.

Система поиска использует технологию Managed OpenSearch. Важным условием было сохранение “сырых” данных в неизмененном виде, чтобы в последующем можно было повторно их обработать, поэтому первичные данные и логи поступают в объектное хранилище S3 Object Storage. Система защиты информации выстроена в соответствии с политикой информационной безопасности университета.

 

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку