Nvidia представила ИИ-ускорители следующего поколения на графических процессорах с архитектурой Blackwell на конференции GTC 2024. По словам производителя, предстоящие ИИ-ускорители позволят создавать еще более крупные нейронные сети, в том числе работать с моделями (LLM) с миллиардами параметров, при этом он в 25 раз более энергоэффективен и экономичен. -эффективен по сравнению с Хоппером.

Архитектура графического процессора Blackwell названа в честь американского математика Дэвида Гарольда Блэквелла и включает в себя ряд инновационных технологий компьютерного ускорения, которые помогут добиться прорыва в обработке данных, инженерном моделировании, автоматизации электронного проектирования, компьютерном дизайне лекарств, квантовых вычислениях и генеративном искусственном интеллекте. Более того, Nvidia придает особое значение этому последнему пункту: «Генераторный ИИ — это определяющая технология нашего времени. Графические процессоры Blackwell способствуют новой промышленной революции», — заявил во время презентации Дженсен Хуанг, генеральный директор Nvidia.

Производитель без лишней скромности описывает графический процессор Nvidia B200 как самый мощный чип в мире. В вычислениях FP4 и FP8 новый графический процессор обеспечивает производительность до 20 и 10 Пфлопс соответственно. Новый графический процессор состоит из двух кристаллов, произведенных по специальной версии 4-нм техпроцесса TSMC 4NP и объединенных с корпусом 2.5D CoWoS-L. Это первый графический процессор Nvidia с чипсетной компоновкой. Чипы соединены шиной NV-HBI с пропускной способностью 10 ТБ/с и работают как один GPU. Всего в новинке 208 миллиардов транзисторов.

VIDIA представила самый мощный чип в мире — Blackwell B200, который проложит путь гигантским нейронным сетям (7 фото)

Один из кристаллов Blackwell — в графическом процессоре таких кристаллов два.
По бокам кристаллов графического процессора расположены восемь стеков памяти HBM3e общей емкостью 192 ГБ, ее пропускная способность достигает 8 ТБ/с. А для объединения нескольких ускорителей Blackwell в единой системе новый графический процессор получил поддержку интерфейса NVLink пятого поколения, обеспечивающего пропускную способность до 1,8 ТБ/с в обоих направлениях. Используя этот интерфейс (NVSwitch 7.2T), можно объединить до 576 графических процессоров в один связку.

ЧИТАТЬ   Кто бы мог сыграть наших любимых друзей, если бы сериал сейчас переделали?

Одним из основных источников превосходной производительности B200 были новые ядра Tensor и второе поколение Transformer Engine. Последний научился более тонко подбирать необходимую для определенных задач точность вычислений, что влияет как на скорость обучения и работы нейронных сетей, так и на максимальный объем поддерживаемых LLM. Nvidia теперь предлагает обучение искусственному интеллекту в формате FP8, а FP4 достаточно для запуска обученных нейронных сетей. Но учтите, что Blackwell поддерживает широкий спектр форматов, включая FP4, FP6, FP8, INT8, BF16, FP16, TF32 и FP64. И во всех случаях, кроме последнего, поддерживаются разреженные вычисления.

VIDIA представила самый мощный чип в мире — Blackwell B200, который проложит путь гигантским нейронным сетям (7 фото)

Флагманским ускорителем новой архитектуры станет суперчип Nvidia Grace Blackwell, сочетающий в себе пару графических процессоров B200 и процессор Nvidia Grace Central Arm с 72 ядрами Neoverse V2. Этот ускоритель занимает половину ширины серверной стойки и имеет TDP до 2,7 кВт. Производительность в операциях FP4 достигает 40 Пфлопс, а в операциях FP8/FP6/INT8 новый GB200 способен выдавать 10 Пфлопс.

Как отмечает сама Nvidia, новый продукт предлагает в 30 раз лучшую производительность, чем Nvidia H100, для рабочих нагрузок, связанных с большими языковыми моделями, и до 25 раз более экономичен и энергоэффективен.

VIDIA представила самый мощный чип в мире — Blackwell B200, который проложит путь гигантским нейронным сетям (7 фото)

Nvidia также продемонстрировала систему GB200 NVL72 — по сути, это серверная стойка, объединяющая 36 суперчипов Grace Blackwell и пару коммутаторов NVSwitch 7.2T. Таким образом, эта система включает в себя 72 графических процессора B200 Blackwell и 36 процессоров Grace, соединенных NVLink пятого поколения. В системе установлено 13,5 ТБ памяти HBM3e с общей пропускной способностью до 576 ТБ/с, а общий объем оперативной памяти достигает 30 ТБ.

VIDIA представила самый мощный чип в мире — Blackwell B200, который проложит путь гигантским нейронным сетям (7 фото)

Платформа GB200 NVL72 работает как один графический процессор с производительностью искусственного интеллекта 1,4 эксафлопс (FP4) и 720 пфлопс (FP8). Эта система станет краеугольным камнем новейшего суперкомпьютера Nvidia — DGX SuperPOD.

ЧИТАТЬ   Аутентификация Kerberos при подключении Java к MSSQL

VIDIA представила самый мощный чип в мире — Blackwell B200, который проложит путь гигантским нейронным сетям (7 фото)

На переднем плане — система HGX с восемью Blackwell. Сзади — суперчип GB200.
Наконец, Nvidia представила серверные системы HGX B100, HGX B200 и DGX B200. Все они предлагают восемь ускорителей Blackwell, соединенных между собой посредством NVLink 5. Системы HGX B100 и HGX B200 не имеют собственного процессора и отличаются только энергопотреблением и, следовательно, мощностью. HGX B100 ограничен TDP 700 Вт и обеспечивает производительность до 112 и 56 Пфлопс в операциях FP4 и FP8/FP6/INT8 соответственно. В свою очередь, HGX B200 имеет TDP 1000 Вт и обеспечивает производительность до 144 и 72 Пфлопс в операциях FP4 и FP8/FP6/INT8 соответственно.

Наконец, DGX B200 аналогичен HGX B200 по производительности, но представляет собой полноценную систему с парой процессоров Intel Xeon Emerald Rapids. По данным Nvidia, DGX B200 в 15 раз быстрее запускает предварительно обученные модели стоимостью в миллиарды долларов по сравнению со своим предшественником.

VIDIA представила самый мощный чип в мире — Blackwell B200, который проложит путь гигантским нейронным сетям (7 фото)

Для создания наиболее масштабных систем искусственного интеллекта, включающих от 10 000 до 100 000 ускорителей GB200 в пределах дата-центра, Nvidia предлагает объединить их в кластеры с помощью сетевых интерфейсов Nvidia Quantum-X800 Ethernet InfiniBand и Spectrum-X800. Они также были анонсированы сегодня и будут предлагать расширенные сетевые возможности со скоростью до 800 Гбит/с.

Многие производители вскоре представят свои системы на базе Nvidia B200, включая Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn и ZT Systems. Nvidia GB200 также является частью платформы Nvidia DGX Cloud, и позже в этом году решения на основе этого суперчипа будут доступны от крупных поставщиков облачных услуг, включая AWS, Google Cloud и Oracle Cloud.
Источник

ЧИТАТЬ   14 человек, которым хочется сказать со смехом: "Ну ты еще экспонат!"

Source

От admin