打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 科技 第1張

DGX SuperPOD系統在MLPerf Training v0.7基準測試中開創了八個全新里程碑,共打破16項紀錄。

作者 | 包永剛

雷鋒網消息,2020年7月30日MLPerf組織發布第三個版本MLPerf Training v0.7基準測試(Benchmark)結果。結果顯示,英偉達基於今年5月最新發布的Ampere架構GPU A100,和HDR InfiniBand實現多個DGX A100 系統互聯的龐大集群——DGX SuperPOD系統在性能上分別開創了八個全新里程碑,共打破16項紀錄。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 科技 第2張

打破MLPerf Training基準測試16項記錄

MLPerf是2018年5月成立的行業基準測試組織,在AI火熱的當下,獲得了晶片巨頭和AI晶片公司的廣泛關註。為了能夠讓機器學習處理器的基準測試也像CPU那樣,MLPerf組織囊括了該行業中的所有知名企業,比如英特爾、英偉達、Google、亞馬遜、阿裡巴巴和百度、微軟等。

這些巨頭公司也樂於通過MLPerf的跑分證明其AI實力,平頭哥在去年11月MLPerf首個版本基準測試成就公布之後就宣傳其AI晶片含光800在Resnet50基準測試中獲得單晶片性能第一。

作為AI領域的領軍者,英偉達自然也不會錯過MLPerf。2018年12月,NVIDIA首次在MLPerf訓練基準測試中創下了六項紀錄,次年7月NVIDIA再次創下八項紀錄。在最新MLPerf Training v0.7基準測試中,有兩項新的測試和一項經大幅修訂的測試。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 科技 第3張

其中,一項基準測試對推薦系統的性能進行了排名,推薦系統是日益普及的一項AI任務。另一項基準測試對使用BERT的對話式AI進行了測試。BERT是現有最龐雜的神經網路模型之一。最後,強化學習測試中使用了Mini-go和全尺寸19×19 圍棋棋盤。該測試是本輪最龐雜的測試,內容涵蓋從遊戲到訓練的多項操作。

特別值得一提的是,英偉達是唯一一家在MLPerf Training v0.7測試中均採用市售商用產品的公司。其他大多數提交使用的公司,要麼是預覽類別(preview category),其所用的產品預計需要幾個月後才會面市,要麼使用的是研究類別的產品,更是在較長的一段時間內都不會面市。

另外,在提交結果的九家公司中,除英偉達外,還有六家公司多家生態系統合作夥伴也提交了基於英偉達GPU的MLPerf測試結果,其中包括三家雲服務提供商(阿裡雲、Google雲和騰訊雲)和三家服務器制造商(戴爾、富士通和浪潮)。

英偉達18個月內實現AI性能4倍提升

創造紀錄的英偉達DGX SuperPOD系統是基於Ampere架構以及Volta架構。雷鋒網此前報導,5月份發布的Ampere架構GPU A100基於臺積電7nm工藝,面積高達826平方毫米,集成了540億個晶體管。相比Volta架構實現了高達20倍的性能提升,並且可以同時滿足AI訓練和推理的需求。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 科技 第4張

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 科技 第5張

A100對比V100

由8個安培A100 GPU打造的NVIDIA DGX A100 AI系統單節點性能達到了創紀錄的5 petaflops。

此次,英偉達在Selene上運行了系統的MLPerf測試,Selene是基於DGX SuperPOD的內部集群。DGX SuperPOD是針對大規模GPU集群的公共參考架構,可在數周內完成部署。

根據測試結果,相較於首輪MLPerf訓練測試中使用的基於V100 GPU的系統,如今的DGX A100系統能夠以相同的吞吐率,在18個月內實現了4倍的性能提升。能夠取得這樣的成就還有兩大關鍵——軟體和網路連接。

A100 GPU搭配CUDA-X庫的軟體更新,為通過Mellanox HDR 200Gb/s InfiniBand網路構建的擴展集群提供支持。HDR InfiniBand可實現極低的延遲和高數據吞吐量,同時通過可擴展分層聚合和縮減協議(SHARP)技術,提供智能深度學習計算加速引擎。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 科技 第6張

英偉達能否無人能敵?

英偉達A100發布之後,就有業內人士表示GPU的性能又上了一個臺階,AI晶片初創公司想要超越英偉達的難度有增加了。

但相比硬件的超越,雷鋒網認為軟硬件生態才是巨頭公司更大的優勢所在。據悉,通過最新的軟體優化,基於NVIDIA V100的DGX-1 系統也可實現2倍的性能提升。

就此次最新基準測試而言,提交了基於英偉達GPU的MLPerf測試結果的公司大多採用了英偉達的軟體中心NGC容易,以及用於參賽的公開框架。另外,包括這些MLPerf合作夥伴在內的近二十家雲服務提供商和OEM組成的生態系統,已採用或計劃採用A100 GPU來打造在線實例、服務器和PCIe卡。

英偉達表示,A100進入市場的速度也比以往英偉達的GPU更快,發布之初用於英偉達的第三代DGX系統,正式發布僅六周後,A100就正式登陸了Google Cloud 。

當然,英偉達也在通過更多行業軟體吸引用戶。比如今年5月,英偉達發布了兩個應用框架——用於對話式AI的Jarvis和用於推薦系統的Merlin。還有面向汽車行業市場的NVIDIA DRIVE,面向醫療健康市場的Clara,面向機器人技術市場的Isaac,以及面向零售/智能城市市場的Metropolis。

性能和生態都足夠好的A100,能讓英偉達在AI市場無人能敵嗎?價格會成為阻礙嗎?

粉絲福利: 目前還有少量CCF-GAIR大會AI晶片專場門票,添加小雷哥微信(ID:leiphonesz2018),獲取限量免費票。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!