Компания Intel поделилась подробными сведениями о своих ускорителях глубокого обучения Spring Crest. Процессор нейронной сети Nervana (Nervana Neural Network Processor for Training – NNP-T) оснащается 24 вычислительными тензорными ядрами и памятью HBM2 объёмом 32 ГБ. Вычислительное устройство включает 27 млрд транзисторов, которые расположены на площади кристалла 688 мм2. Как ни странно, NNP-T также включает в себя передовые технологии от Intel-конкурента TSMC.
В процессоре NNP-T применяется многочиповая компоновка, когда отдельные блоки выполнены в виде отдельных кристаллов, объединённых между собой скоростной шиной для обмена данными. Главный вычислительный модуль изготавливается по нормам 16-нанометрового технологического процесса CLN16FF+ компании TSMC. Помимо 24 тензорных ядер он также включает 60 МБ памяти SRAM, которая распределена по всему кристаллу. Часть площади кристалла также выделена для элементов управления и интерфейсов. Именно этот вычислительный блок и занимает площадь 688 мм2.
Вычислительный модуль NNP-T окружён четырьмя стеками памяти HBM2-2400 ёмкостью по 8 ГБ со скоростью передачи данных 2,4 ГБ/с на вывод. Вся эта конструкция расположена поверх массивного кремниевого промежуточного модуля площадью уже 1200 мм2. Вычислительный блок и блоки памяти HBM взаимосвязаны посредством межсоединения TSMC CoWoS (Chip-on-Wafer-on-Substrate). Вся эта конструкция размещается в корпусе размерами 60×60 мм с 3325-контактным BGA-интерфейсом.
Чип работает на частоте 1,1 ГГц. При использовании воздушного охлаждения он потребляет от 150 Вт до 250 Вт энергии. В дальнейшем также может появиться и более производительная конфигурация с повышенными частотами, требующая использования жидкостной системы охлаждения.
Процессор NNP-T поставляется в форм-факторах карт OCP Accelerator Module (OAM) (в настоящее время — это гибридная сетка кубов) благодаря своим возможностям охлаждения и подключения. Карты OCP распространены в гипермасштабных центрах обработки данных. Кроме того, NNP-T также поддерживает традиционные форм-факторы карт PCIe.
Используемая архитектура поддерживает масштабирование до 1024 узлов с 8 процессорами NNP-T. Однако сама Intel говорит, что архитектура хорошо масштабируется до 256 карт, а возможно и выше. Более подробные тесты будут опубликованы дополнительно.
Intel заявляет, что к концу текущего года предоставит образцы NNP-T своим крупным заказчикам, уделив особое внимание поставщикам облачных сервисов первого уровня. Для более широкого перечня заказчиков новинка станет доступной уже в 2020 году.
Источник: ITC.ua