尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
英偉達剛剛公布了採用 Ampere 架構的 A100 GPU 的首份實際性能數據:可知其在特定的 AI 基準測試項目中一共打破了 16 項性能紀錄,速度是 Volta V100 的 4.2 倍,較主要競爭對手取得了巨大的領先優勢。首先,2018 年面世的 MLPerf 主要側重於機器學習性能。該基準測試套件總共包括了八項測試,但英偉達 Ampere A100 GPU 的訓練速度已經全面實現了超越。
(來自:Nvidia)
其次,英偉達分享了 DGX SuperPOD 系統取得的八項新紀錄。該系統通過 HDR InfiniBand 連接到一起,構成了一個龐大的 DGX A100 高性能計算系統集群。
DGX SuperPod 由 140 個 DGX A100 系統組成,共計擁有 1120 個 NVIDIA Ampere A100 GPU、170 個 Mellanox Quantum 200G Infiniband 交換機、4 PB 存儲空間、以及 15 公里的光纜。
令人讚嘆的 DGX SuperPod 系統中包括大約 770 萬個 Ampere CUDA 核心,作為 DGX V 擴展計劃的一部分,其為該系統增加了近乎 700 Petaflops 的算力,目前已部署在加州聖克拉拉市的英偉達公司總部。
通過與上一代 Volta V100(以及Google第三代 TPU 和 Ascend HPC 等新品)進行比較,可知 Ampere A100 Tensor Core GPU 加速卡的性能增長也是相當驚人。
此外在 MLPerf 基準測試套件的詳細結果中,還對即將推出的 AI 加速方案進行了預覽,比如的 Cooper Lake-SP 至強處理器、以及Google的第四代 TPU 。
MLPerf 表示,其基準測試套件可對機器學習(ML)和人工智慧(AI)工作負載進行評估,結果發現 Ampere A100 性能是 Volta V100 的 2.5 倍。即便是提升最小的項目,其領先幅度也有近 50% 。
相比之下,華為 Ascend 晶片只能及時完成一項測試、且性能遠不及 Volta V100 。Google第三代 TPU 也只能及時完成兩項測試,第一項較 Volta V100 領先 20%,第二項卻又落後 10% 。
至於八槽的 Cooper Lake-SP 平臺,其能夠在 1104.53 分鐘內完成圖像分類測試項目,但是英偉達的雙 Ampere A100 系統只需 33.37 分鐘。至於明年的Google第四代 TPU,目前尚不知曉其具有多大的優勢。
最後,英偉達展示了其 GPU 加速卡在 AI Full-Stack Innovations 項目中的表現。上一代 Volta V100 平臺的 MLPerf 0.5 基準測試項目對比,Ampere A100 平臺上的的 MLPerf 0.7 基準測試有 4.2 倍的性能提升。