據寒武紀官方消息,寒武紀今天正式發布新款訓練加速卡 MLU370-X8,搭載雙芯片四芯粒思元 370,集成寒武紀 MLU-Link 多芯互聯技術,主要面向訓練任務。

寒武紀表示,在業界應用廣泛的 YOLOv3、Transformer 等訓練任務中,8 卡計算系統的并行性能平均達到 350W RTX GPU 的 155%。
MLU370-X8 采用了 7nm 工藝,配備 48GB LPDDR5 內存,FP32 單精度浮點性能達到 24 TFLOPS。

據介紹,MLU370-X8 智能加速卡提供 250W 最大訓練功耗,可充分發揮 AI 訓練加速中常見的 FP32、FP16 或 BF16 計算性能。寒武紀首次將雙芯片四芯粒思元 370 整合在 MLU370-X8 智能加速卡中,提供了兩倍于標準思元 370 加速卡的內存、編解碼資源,同時搭載 MLU-Link™多芯互聯技術。

MLU370-X8 智能加速卡支持 MLU-Link™多芯互聯技術,提供卡內及卡間互聯功能。寒武紀為多卡系統專門設計了 MLU-Link 橋接卡,可實現 4 張加速卡為一組的 8 顆思元 370 芯片全互聯,每張加速卡可獲得 200GB / s 的通訊吞吐性能,帶寬為 PCIe 4.0 的 3.1 倍,可高效執行多芯多卡訓練和分布式推理任務。

▲ MLU370-X8 單機 8 卡部署配置
特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。