英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍

2020-07-31 尋夢園科技 214 Views

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接❤️

英偉達剛剛公布了採用 Ampere 架構的 A100 GPU 的首份實際性能數據：可知其在特定的 AI 基準測試項目中一共打破了 16 項性能紀錄，速度是 Volta V100 的 4.2 倍，較主要競爭對手取得了巨大的領先優勢。首先，2018 年面世的 MLPerf 主要側重於機器學習性能。該基準測試套件總共包括了八項測試，但英偉達 Ampere A100 GPU 的訓練速度已經全面實現了超越。

英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍科技第1張

（來自：Nvidia）

其次，英偉達分享了 DGX SuperPOD 系統取得的八項新紀錄。該系統通過 HDR InfiniBand 連接到一起，構成了一個龐大的 DGX A100 高性能計算系統集群。

DGX SuperPod 由 140 個 DGX A100 系統組成，共計擁有 1120 個 NVIDIA Ampere A100 GPU、170 個 Mellanox Quantum 200G Infiniband 交換機、4 PB 存儲空間、以及 15 公里的光纜。

英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍科技第2張

令人讚嘆的 DGX SuperPod 系統中包括大約 770 萬個 Ampere CUDA 核心，作為 DGX V 擴展計劃的一部分，其為該系統增加了近乎 700 Petaflops 的算力，目前已部署在加州聖克拉拉市的英偉達公司總部。

英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍科技第3張

通過與上一代 Volta V100（以及Google第三代 TPU 和 Ascend HPC 等新品）進行比較，可知 Ampere A100 Tensor Core GPU 加速卡的性能增長也是相當驚人。

此外在 MLPerf 基準測試套件的詳細結果中，還對即將推出的 AI 加速方案進行了預覽，比如的 Cooper Lake-SP 至強處理器、以及Google的第四代 TPU 。

英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍科技第4張

MLPerf 表示，其基準測試套件可對機器學習（ML）和人工智慧（AI）工作負載進行評估，結果發現 Ampere A100 性能是 Volta V100 的 2.5 倍。即便是提升最小的項目，其領先幅度也有近 50% 。

相比之下，華為 Ascend 晶片只能及時完成一項測試、且性能遠不及 Volta V100 。Google第三代 TPU 也只能及時完成兩項測試，第一項較 Volta V100 領先 20%，第二項卻又落後 10% 。

英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍科技第5張

至於八槽的 Cooper Lake-SP 平臺，其能夠在 1104.53 分鐘內完成圖像分類測試項目，但是英偉達的雙 Ampere A100 系統只需 33.37 分鐘。至於明年的Google第四代 TPU，目前尚不知曉其具有多大的優勢。

英偉達Ampere A100打破16項AI性能紀錄速度是Volta V100的4.2倍科技第6張

最後，英偉達展示了其 GPU 加速卡在 AI Full-Stack Innovations 項目中的表現。上一代 Volta V100 平臺的 MLPerf 0.5 基準測試項目對比，Ampere A100 平臺上的的 MLPerf 0.7 基準測試有 4.2 倍的性能提升。

About 尋夢園

尋夢園是台灣最大的聊天室及交友社群網站。致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。擁有數百間不同的聊天室，讓您隨時隨地都能找到志同道合的好友！

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接❤️

更多文章