作為GPU加速應用領域最強大的軟件開發平臺,NVIDIA近日了發布全新的CUDA 11版本工具包,特別為新誕生的安培架構進行了優化。
CUDA 11完全支持在安培新架構上進行開發,包括A100 GPU,以及基于它的DGX A100、HGX A100等多路系統,并支持安培架構的第三代Tensor張量核心,可針對不同數據類型加速混合精度矩陣計算,比如TF32、Bfloat16。
其他新技能:
- 多實例GPU虛擬化和GPU分區,提升GPU利用率
- 優化庫性能,包括線性代數、快速傅里葉變換(FFT)、矩陣乘法、JPEG解碼等等
- 改進編程與API,包括任務圖表、異步數據轉移、精細同步、二級緩存駐留管理等等
- 增強Nsight開發工具集,包括跟蹤、編譯、調試分析
- 完整支持各種主要CPU架構,包括x86、ARM64、Power
- CUDA C++改進編譯器性能和穩定性、支持新的主編譯器和語言標準(包括C++17)、支持Parallel C++ STL
- 更新操作系統支持
更詳細介紹請參閱:
https://devblogs.nvidia.com/cuda-11-features-revealed/

特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。