Накопители

AMD в секретной презентации пообещала Radeon Instinct MI100, который превзойдёт NVIDIA A100. Надо только подождать

Предполагаемые показатели производительности и детали об ускорителе Radeon Instinct MI100 на базе архитектуры CDNA следующего поколения были опубликованы ресурсом AdoredTV вместе со слайдами от компании AMD. В публикации рассказывается о производительности этого ускорителя HPC в сравнении с NVIDIA Volta и Ampere.

AdoredTV утверждает, что в их распоряжение попали слайды из официальной презентации AMD Radeon Instinct MI100. Они были переделаны во избежание обвинений, но все данные, как сообщается, оставлены нетронутыми. Прежде всего, в них сообщается о времени выхода ускорителя и серверных конфигураций с ним от партнёров.

Например, серверы с Radeon Instinct MI100 формата 1U с процессорами AMD EPYC поколений Rome и Milan должен быть запущен к декабрю 2020 года, в то время как вариант на базе Intel Xeon выйдет в феврале 2021 года. Такой сервер будет включать два процессора AMD EPYC. Каждый из них будет подключён к двум ускорителям Radeon Instinct MI100 через межкомпонентное соединение 2-го поколения Infinity Fabric. Четыре ускорителя вычислений на GPU смогут обеспечить 136 терафлопс производительности в операциях FP32 (SGEMM), то есть каждая карта Radeon Instinct MI100 способна обеспечить 34 терафлопса вычислительной мощи при потреблении в 300 Вт.

Среди прочих особенностей заявлена общая пропускная способность графики через PCIe в 256 Гбайт/с, что стало возможным благодаря PCIe 4.0. Объединённая пропускная способность памяти четырёх графических процессоров составляет 4,9 Тбайт/с, что означает, что AMD использует память HBM2e DRAM (каждый ГП имеет полосу пропускания в 1,225 Тбайт/с). Общий объём составляет 128 Гбайт или 32 Гбайт на каждый ГП.

Ожидается, что второй сервер 3U будет запущен в марте 2021 года и предложит ещё более впечатляющие спецификации: 8 Radeon Instinct MI100, подключённых к двум процессорам EPYC. Четыре ускорителя Instinct будут обеспечивать 272 терафлопс вычислительной мощи FP32, предлагать пропускную способность через PCIe в 512 Гбайт/с, пропускную способность HBM в 9,8 Тбайт/с и иметь в совокупности 256 Гбайт видеопамяти. Потребление одной такой стойки составит 3 кВт.

По производительности AMD сравнила Radeon Instinct MI100 с ускорителями NVIDIA Volta V100 и Ampere A100. Интересно, что на слайдах упоминается ускоритель Ampere A100 мощностью 300 Вт, хотя такого варианта не существует: видимо, AMD говорит о гипотетической конфигурации A100. Сейчас есть только модели на 400 Вт (SXM) и на 250 Вт (PCIe).

Согласно данным от AMD, её ускоритель Radeon Instinct MI100 обеспечивает примерно на 13 % более высокую производительность FP32 по сравнению с NVIDIA A100 (Ampere) и более чем 2-кратный прирост по отношению к Tesla V100 (Volta). По показателю производительности на доллар MI100 превосходит V100 в 2,4 раза, а A100 — в 1,5 раза. Также показано, что масштабирование производительности является почти линейным даже при использовании до 32 ускорителей в Resenet, что весьма впечатляет.

На слайдах упоминается, что AMD предложит гораздо более высокую производительность в таких сегментах, как нефтегазовая отрасль, академические исследования и машинное обучение. В остальных рабочих нагрузках HPC, таких как вычисления FP64, ИИ или Data Analytics за NVIDIA A100, похоже, остаётся существенное преимущество.

Источник

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть