VK Data Platform стало легче развернуть в собственном контуре: требования к инфраструктурным ресурсам снижены в 2,5 раза для отказоустойчивой конфигурации, что уменьшает капитальные затраты на старте.
Для того, чтобы отвечать на вопросы сотрудников, помогать в аналитике и автоматизировать решения, агентам нужны подготовленные корпоративные данные — документы, отчеты, регламенты, обращения, транзакции, производственные и клиентские данные. VK Data Platform помогает собрать эти данные в едином управляемом корпоративном хранилище, подготовить их для BI, ML и RAG-сценариев и обеспечить контроль доступа внутри периметра заказчика. Новый формат поставки снижает порог входа для компаний, которым нужен собственный контур для аналитики, BI, ML и будущих ИИ-сценариев.
Основной слой аналитики хранится в S3-совместимом VK Object Storage. Для исторических и редко используемых данных может применяться более экономичный HDD-класс хранения. По оценке VK Tech, основанной на стоимости закупки дисков, это может снижать стоимость хранения до 10 раз по сравнению с размещением всего массива аналитических данных на SSD/NVMe в классическом DWH.
Чтобы данные в S3 были управляемой основой для аналитики, в платформе внедрен табличный слой Apache Iceberg. Он позволяет работать с данными как с аналитическими таблицами: согласовано обновлять их, менять структуру, хранить версии и откатываться к предыдущим состояниям. Это важно для BI, ML, RAG и AI-сценариев, где нужны проверяемые, актуальные и воспроизводимые данные.
«Новый формат поставки VK Data Platform снижает инфраструктурный порог входа, ускоряет внедрение и делает масштабирование платформы экономически более рациональным. Решение построено на архитектуре Data Lakehouse: хранение и вычисления разделены, поэтому компании могут наращивать объем данных без пропорционального расширения вычислительных ресурсов.», — отметила директор по продуктам направления «Дата-сервисы» VK Tech Екатерина Канунникова.
Источник: VK Tech
* VK Tech — ВК Тех

