Российские компании перестали наращивать число серверов с графическими ускорителями, переключившись на более производительные премиальные GPU-конфигурации. Основной драйвер — задачи искусственного интеллекта и машинного обучения, требующие больших ресурсов видеопамяти и скорости обмена данными.
Рег.облако, облачный и Bare metal провайдер, изучил структуру спроса на выделенную инфраструктуру в сегменте крупного и среднего бизнеса. По данным аналитиков, средняя стоимость GPU-конфигураций в 2025 году выросла в два раза, а с начала 2026 года — еще в два раза. При этом общее количество серверов с графическими ускорителями в парке клиентов существенно не изменилось — бизнес отказывается от бюджетных конфигураций в пользу высокопроизводительных GPU-серверов.
Сдвиг в структуре потребления выделенной инфраструктуры связан с усложнением требований со стороны бизнеса. Крупным и средним компаниям всё чаще нужны не просто ресурсы в облаке или сервере, а предсказуемая производительность, изоляция вычислительной среды и полный контроль над инфраструктурой. В общем объеме потребления 70% по-прежнему приходится на базовые выделенные серверы, а 30% — на системы хранения данных и дисковую инфраструктуру. Однако для проектов в сфере ИИ и машинного обучения заказчики меняют подход.
Компании отказываются от отдельных выделенных хранилищ в пользу серверов с большим количеством NVMe-дисков. Это позволяет размещать ИИ-модели, наборы данных и промежуточные результаты вычислений внутри собственной инфраструктуры, без лишних задержек на внешний обмен. На одну компанию сегодня в среднем приходится от двух до восьми видеокарт — H200, H100, А6000, А4000 — в зависимости от масштаба проекта. Почти половина спроса на GPU-серверы (46%) приходится на конфигурации с объемом видеопамяти до 24 ГБ. Решения с 48 ГБ занимают 13,5%, а более четверти — около 27% — формируют высокопроизводительные конфигурации от 80 ГБ.
Эксперты Рег.облака связывают такую тенденцию с тем, что современные ИИ-модели требуют более мощные вычислительные мощности и объем памяти, а также высокой скорости обмена данными между ускорителями. Чуть более года назад такие карты, как H100 и H200, были доступны в основном крупным игрокам по квотам, а теперь постепенно выходят на более широкий рынок. Отдельный интерес компании проявляют к H200 в SXM-исполнении: для тяжелых ИИ-задач важна производительность не только самих ускорителей, но и всей серверной платформы в целом. По данным Рег.облака, доля премиальных GPU-конфигураций в общем потреблении серверов выросла с 51% до 78%. Треть заказов на GPU-серверы (33%) сегодня связана с искусственным интеллектом и машинным обучением, 30% — с рендерингом, 25% — с тестированием и разработкой, ещё 12% — с обработкой данных. Этот портрет спроса принципиально отличается от классической модели аренды сервера под корпоративный портал или ИТ-систему.
«Бизнесу нужна не отдельная машина, а сбалансированная конфигурация, объединяющая вычислительные ресурсы, дисковую емкость и устойчивую производительность под длительную нагрузку. Рост интереса к выделенным серверам и Bare metal решениям не означает отказа от публичного облака — рынок, напротив, четко делится по сценариям использования. Облачные сервисы по-прежнему выбирают для быстрого запуска проектов, тестирования и гибкого масштабирования», — отмечает Сергей Белов, операционный директор Рег.облака.
По данным аналитиков Рег.облака, компании предпочитают выделенную инфраструктуру для постоянных высоконагруженных систем, корпоративных приложений, обработки больших данных и специализированных вычислений, где критична стабильность и предсказуемость. Сложившийся тренд на удорожание GPU-конфигураций отражает не временную конъюнктуру, а структурный сдвиг в сторону задач с использованием технологий ИИ, который будет только усиливаться.
Источник: Рег.облако



