Модель работает внутри закрытого контура и на данный момент оптимизирует четыре ключевых сценария работы инженеров по мониторингу ИТ-инфраструктуры.
Почему не внешний API
Подключение к коммерческим LLM — ChatGPT, GigaChat, YandexGPT — даёт быстрый старт, но сопряжено с ограничениями. Данные о событиях ИТ-инфраструктуры покидают периметр компании, модель не обладает контекстом конкретной среды, а качество ответа напрямую зависит от полноты промпта. Для крупного бизнеса и организаций государственного сектора передача операционных данных во внешние сервисы нередко исключена как по юридическим, так и по организационным причинам.
Собственная модель, дообученная на специализированных данных, решает профильные задачи точнее и полностью остаётся внутри инфраструктуры заказчика.
«Мы хотели, чтобы инженер по мониторингу тратил время на решение инцидентов, а не на поиск документации и составление регулярных выражений. LLM в версии 1.6.0 — это первый шаг к тому, чтобы платформа сама брала на себя рутину», — отмечает Никита Гладких, руководитель продукта Artimate.
Четыре сценария первого этапа интеграции LLM в платформу
В версии 1.6.0 LLM интегрирована в четыре направления.
Поиск по внутренней базе знаний компании (RAG).
Раньше инженер, которому нужна была инструкция — например, как настроить интеграцию с Zabbix— переключался между вкладками wiki и внутренними хранилищами документации, тратя на поиск несколько минут. Теперь LLM подключена к единому корпоративному хранилищу: пользователь задает вопрос на естественном языке прямо в интерфейсе Artimate и получает точный ответ с пошаговой инструкцией.
В результате сокращается время на поиск по базе знаний, а работа с документацией становится частью одного рабочего окна.
Подбор регулярных выражений
Настройка правил обогащения событий требует умения составлять регулярные выражения — навыка, которым обладают не все специалисты по мониторингу. Теперь в диалоговом окне достаточно описать задачу словами: «Составь регулярное выражение для поиска IP-адресов в событиях». LLM анализирует запрос, сверяет его с существующим справочником Regex и либо предлагает оптимальное готовое решение, либо генерирует новое выражение с пояснением логики, исключая ошибки при ручном копировании сложных конструкций.
В результате настройка обогащения ускоряется, снижается зависимость от узких технических навыков и уменьшается риск ошибок при ручной работе с шаблонами.
Присвоение кластерам имен на основе входящих в них событий в модели кластеризации
Стандартные алгоритмы кластеризации часто формируют технические группы с обезличенными названиями вроде cluster47, которые не помогают быстро понять, что именно произошло в системе. Чтобы упростить работу инженера, LLM анализирует состав каждого кластера и подбирает для него смысловое название, отражающее общий характер входящих событий. Пользователь запускает переименование прямо на странице модели кластеризации после расчета и получает кластеры с понятными названиями, которые проще использовать в анализе и при работе с корреляционным графом.
В результате не нужно вручную просматривать содержимое каждого кластера, а структура инцидентов становится понятнее с первого взгляда
Оптимизация кластеров
Даже после расчета модели кластеризации остается возможность улучшить маски и повысить качество группировки событий. Если делать это вручную, специалисту нужно глубоко погружаться в контекст каждого кластера, сопоставлять события между собой и тратить на анализ много времени. LLM упрощает этот процесс: она получает список событий, видит их распределение по кластерам и на основе взаимосвязей предлагает, какие кластеры стоит объединить, а какие — разделить. Пользователь отправляет запрос на оптимизацию и получает понятное объяснение причин, например: «Рекомендуется объединить cluster1 и cluster2, так как оба лога относятся к ошибкам HDFS при распределении блоков».
В результате повышается точность модели кластеризации, а сама система постепенно становится более “умной”: инженеры получают экспертные подсказки там, где раньше уходили часы на ручное исследование.
Планы по развитию
Релиз 1.6.0 — первый этап встраивания LLM в платформу. В ближайших планах команды — расширить применение модели на создание сущностей через диалоговое окно и автоматическую подготовку отчётов с анализом инцидентов.
Источник: Artimate



