AMD на конференции SC19: топовая производительность в суперкомпьютерных вычислениях и HPC в облаке

На конференции SC19, знаковом ежегодном событии в сфере суперкомпьютеров, компания AMD (NASDAQ: AMD) рассказала об укреплении своих позиций в области высокопроизводительных вычислений (HPC) благодаря ряду новых заказчиков и применению продуктов AMD в ведущих исследовательских системах по всему миру, новых платформах, поддерживающих процессоры AMD EPYC ™ и ускорители Radeon Instinct™, а также недавно анонсированной ROCm 3.0, обеспечивающая поддержку новых компиляторов и приложений HPC.

«Компания AMD участвует в SC19 в качестве поставщика процессоров для будущего суперкомпьютера Frontier. Он будет выпущен в 2021 году и, как ожидается, станет самым высокопроизводительным суперкомпьютером в мире, — сказал Марк Пейпермастер, исполнительный вице-президент и технический директор компании AMD. — Участники конференции на этой неделе могут познакомиться с основополагающими технологиями AMD, которые войдут в эту систему экзафлопсной производительности. На SC19 представлены и высокопроизводительные процессоры AMD EPYC, и графические процессоры Radeon Instinct, работающие вместе через высокоскоростные интерконнекты, а также наша экосистема открытого ПО, которое поставляется самыми выдающимися игроками рынка суперкомпьютерных вычислений».

На SC19 Марк Пейпермастер вместе с техническими экспертами Cray, CERN и Xilinx принял участие в панельной дискуссии, чтобы обсудить уникальные инновации в системах экзафлопсной производительности и за их пределами, включая новые технические достижения в области аппаратного, программного обеспечения и инструментов программирования.

 

Новые оптимизированные для вычислений инстансы Amazon EC2 на базе AMD EPYC второго поколения

Amazon Web Services (AWS) расширяет использование процессоров AMD EPYC. Платформа объявила о предстоящем запуске двух новых инстансов Amazon Elastic Compute Cloud (Amazon EC2), оптимизированных для вычислений. Эти инстансы, C5a и C5ad, будут работать на базе специально созданных процессоров AMD EPYC второго поколения, которые обеспечат частоту до 3,3 ГГц. C5a и C5ad будут поставляться в 8 виртуализированных размерах, каждый до 96 виртуальных ЦП, что предоставит клиентам дополнительные возможности для оптимизации как стоимости, так и производительности различных вычислительных нагрузок, включая пакетную обработку данных, расширенную аналитику и работу в веб-приложениях. Оба инстанса будут доступны и для платформы без операционной системы, что позволит пользователям запускать те приложения, которым нужен прямой доступ к процессору и ресурсам памяти основного сервера. Инстансы будут иметь 192 логических процессора на 96 физических ядрах, что вдвое больше размера инстанса, предлагаемого в семействе оптимизированных для вычислений инстансов EC2. C5a и C5ad с открытым исходным кодом смогут использовать пропускную способность сети 100 Гбит/с и будут совместимы с интерфейсом Elastic Fabric Adapter. Это позволит заказчикам масштабировать высокопроизводительные вычисления и другие большие вычислительные нагрузки. Новые инстансы скоро будут доступны в многочисленных регионах, в которых представлена AWS.

 

Компания AMD выводит суперкомпьютеры на новый уровень, и процессоры EPYC входят в TOП-500

Компании в области HPC продолжают использовать процессоры AMD EPYC второго поколения и ускорители Radeon Instinct, чтобы повысить мощность и эффективность суперкомпьютерных вычислений. Процессоры EPYC второго поколения обеспечивают в два раза более высокую производительность для производственных приложений[i] и до 60% более быстрое моделирование в области медико-биологических разработок по сравнению с конкурентными решениями[ii],[iii]. GPU-ускоритель Radeon Instinct обеспечивает до 6,6 ТФЛОПС пиковой теоретической производительности в операциях с двойной точностью для рабочих нагрузок в сфере HPC. И процессоры, и ускорители поддерживают интерфейс PCIe® 4.0, что обеспечивает высокую пропускную способность интерконнекта для ускорения вычислений в гетерогенных системах.

 

Среди новых клиентов, внедряющих процессоры и ускорители AMD, следующие компании:

  • Atos, мировой лидер в области цифровых преобразований, поставляет два суперкомпьютера BullSequana XH2000 на базе процессоров EPYC второго поколения для компании Météo-France. Они позволят оперативно прогнозировать погоду и проводить исследования атмосферы, океана и климата.
  • Atos и французская национальная организация высокопроизводительных вычислений, GENCI, объявили о новейшем расширении суперкомпьютера Joliot-Curie, расположенного и управляемого командами CEA в TGCC (Very Large Computing Center). Оно основано на решении Atos BullSequana XH2000 и процессорах EPYC второго поколения.
  • Расширение Joliot-Curie вошло в 54-й мировой рейтинг TOР-500. Joliot-Curie стал первым суперкомпьютером на базе 64-ядерного процессора AMD EPYC 7H12 с TDP 280 Ватт[iv] в этом списке.
  • Компания Cray, принадлежащая Hewlett Packard Enterprise, недавно анонсировала два новых суперкомпьютера на базе процессоров AMD EPYC второго поколения и архитектуре суперкомпьютеров Shasta™, ARCHER2 и Vulcan.
  • Dell Technologies оснащает Суперкомпьютерный центр Сан-Диего и его суперкомпьютер Expanse серверами Dell EMC PowerEdge и процессорами EPYC второго поколения.
  • Швейцарская высшая техническая школа Цюриха (ETH) использует процессоры AMD EPYC 7742 в своей системе Euler VI.
  • Компания NEC поставляет немецкой службе прогнозирования погоды Deutscher Wetterdienst систему, использующую процессоры EPYC второго поколения в сочетании с векторными процессорами NEC SX-Aurora TSUBASA.

«Мы выбрали AMD EPYC 7742, потому что этот процессор не только обеспечивал широкую поддержку большинства популярных приложений, которые используют наши исследователи, но и предоставляет высокую производительность, впечатляющую пропускную способность памяти и операций ввода-вывода. А, самое главное, процессор отличается превосходным соотношением цены и производительности, необходимой исследователям, — сказал Кристиан Боллигер, специалист научного ИТ-сервиса, ETH Zurich. — Благодаря системе Euler VI, использующей процессоры AMD EPYC второго поколения, наши пользователи теперь имеют доступ к системе, которая предоставляет им все возможности для проведения их исследований».

 

Использование суперкомпьютерных вычислений в облаке с помощью AMD EPYC

Индустрия высокопроизводительных вычислений развивается, чтобы соответствовать увеличивающимся требованиям к производительности, выполнять новые рабочие нагрузки и, самое главное, облегчать доступ долгосрочный или временный доступ к HPC. Это достигается с помощью облачных платформ, которые теперь могут обеспечить пользователям высокий уровень производительности при более низких затратах на использование по сравнению с тем, что можно получить в локальной среде.

Microsoft Azure анонсировала облачные инстансы Azure HB, работающие в системе на базе процессора EPYC первого поколения. Они выводят уровень производительности для вычислительной гидродинамики (CFD) на совершенно новый уровень.

Благодаря виртуальным машинам Azure HBv2 для высокопроизводительных вычислений Azure еще сильнее расширяет границы HPC в облаке. Эти виртуальные машины на базе процессора AMD EPYC 7742 предоставляют заказчикам до 80 000 ядер и доступ к производительности суперкомпьютера, поддерживая пропускную способность до 200 Гбит/с в HDR InfiniBand и при этом обеспечивая легкость работы в облаке.

AMD представляет ROCm 3.0

Поддержка сообществом пре-экзафлопсной экосистемы ПО продолжает расти. Эта экосистема основана на ROCm, ПО AMD с открытым исходным кодом для GPU-вычислений. Цикл разработки ROCm носит ежемесячный характер, благодаря чему разработчикам регулярно предоставляются улучшения и обновления для компиляторов, библиотек, профилировщиков, отладчиков и инструментов управления системой. Основные этапы разработки, представленные на SC19, включают в себя:

  • Внедрение инновационного ROCm0 для поддержки HIP-clang — компилятора, основанного на LLVM, улучшение возможности транслирования кода CUDA с помощью инструмента HIPify, а также оптимизация библиотек как для HPC, так и для ML (Machine Learning).
  • Интеграция ROCm в ведущие платформы машинного обучения TensorFlow и PyTorch для обеспечения таких задач, как стимулированное обучение, автономное вождение и обнаружение изображений и видео.
  • Расширенная поддержка ускорения для моделей программирования HPC и таких задач, как программирование с использованием библиотеки OpenMP и работа в приложениях LAMMPS и NAMD.
  • Поддержка таких средств развертывания системы и рабочей нагрузки, как Kubernetes, Singularity, SLURM, TAU и др.

 

Растущая аппаратная экосистема

Поскольку системы HPC должны поддерживать всё более требовательные рабочие нагрузки, потребность в гетерогенных вычислениях на базе процессоров и ускорителей является критически важной для современных систем HPC. Партнеры компании AMD создают платформы, которые поддерживают этот спрос, а также традиционные вычисления только на процессорах:

  • GIGABYTE анонсировала четыре новых GPU-сервера G-серии, которые поддерживают процессоры AMD EPYC второго поколения: G292-Z22, G292-Z42, G482-Z50 и G482-Z Сервер G482-Z51 может поддерживать до восьми карт и стандарт PCIe 4.0, предоставляя клиентам решения «AMD + AMD» для ряда ускоренных вычислительных нагрузок.
  • устанавливающим мировые рекорды серверам новые модели Gen10 Plus
  • Благодаря новому серверу Penguin Altus® XE4218GT, поддерживающему до 8 графических процессоров, заказчики Penguin имеют решение «AMD + AMD»: процессоры EPYC второго поколения с поддержкой PCIe 4.0 и ускоритель Radeon Instinct MI50 для обеспечения машинного обучения, анализа больших данных и выполнения аналогичных рабочих нагрузок.
  • Компания Tyan также анонсировала новые платформы в линейке продуктов Transport HX, предназначенных для HPC, и Transport SX для работы с большими данными. Обе линейки используют процессоры AMD EPYC второго поколения.

Внедрив поддержку PCIe 4.0 в процессорах AMD EPYC второго поколения и ускорителях Radeon Instinct, компания AMD в тесном сотрудничестве с ключевыми отраслевыми партнерами стала инициатором создания экосистемы PCIe 4.0. Процессоры EPYC второго поколения совместимы с такими устройствами, поддерживающими интерфейс PCIe 4.0, как высокоскоростные Ethernet-соединения и интерконнекты InfiniBand®, сетевые адаптеры и коммутаторы, ускорители вычислений (графические процессоры и FPGA) и устройства хранения данных (NVME SSD). Среди партнёров, предлагающих продукты PCIe 4.0 для процессоров EPYC второго поколения, такие компании как:

  • Ethernet-контроллер Broadcom Thor NIC 200 ГБ.
  • Адаптер Mellanox ConnectX-6 NIC с пропускной способностью InfiniBand ~400 ГБ/с.
  • Твердотельный накопитель Samsung Gen4 PM1733, обеспечивающий двукратное увеличение количества операций ввода-вывода в секунду по сравнению с Samsung Gen3 SSD.
  • Ускорители Xilinx Alveo U50, U280 с матрицей FPGA.

 

[i] На основе внутреннего тестирования AMD в бенчмарке ANSYS FLUENT 19.1, lm6000_16m по состоянию на 17 июля 2019 года. Тестирование проводилось с использованием 2P сервера на базе EPYC 7742 по сравнению с 2P сервером на базе Intel Xeon Platinum 8280. Результаты могут отличаться. ROM-42

[ii] На основе внутреннего тестирования AMD 30 июля 2019 с использованием 2Р сервера на базе AMD EPYC 7742 по сравнению с 2P сервером на базе в бенчмарке GROMACS версии 2019.3. Результаты могут отличаться. ROM-113

[iii]  «Лучший в своем классе на базе стандартных процессоров X86 с микросхемами LGA. EPYC-08»

[iv] Разгон частоты процессора EPYC 7H12 может быть достигнут только с помощью охлаждающего решения, отвечающего требованиям группы «Z». Достижимые частоты могут варьироваться в зависимости от эффективности самого решения для охлаждения. ROM-282

сайте

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку