尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
集微網消息,ISC高性能計算大會 2021期間,英偉達宣布在NVIDIA HGX AI超級計算平臺中加入融合了AI與高性能計算的新技術,使越來越多的行業能夠充分地利用超級計算的力量。
據了解,英偉達在HGX平臺中加入三項關鍵技術:NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand網路和NVIDIA Magnum IO GPUDirect Storage軟體。
A100 80GB PCIe GPU基於NVIDIA Ampere架構。該架構內置Multi-Instance GPU(MIG)功能,可為AI推理等小型工作負載提供加速。MIG允許HPC系統縮小計算和記憶體規模的同時並保證服務質量。除了PCIe之外,還有四卡和八卡的NVIDIA HGX A100配置。與A100 40GB相比,A100 80GB PCIe GPU的記憶體頻寬增加了25%,達到2TB/s,並且提供80GB的HBM2e高頻寬記憶體。
NVIDIA InfiniBand是全球唯一具有完全移除功能的網路計算的互聯絡統,通過NDR InfiniBand網路可以輕松擴展性能,以應對產業HPC和科學HPC系統面臨的大量挑戰。基於NVIDIA Quantum-2單晶片的交換機系統可提供64個NDR 400Gb/s InfiniBand端口(或128個NDR200端口),其端口密度比HDR InfiniBand高出3倍。NVIDIA Quantum-2模塊化交換機提供了可擴展的端口配置選項,最高可提供2048個NDR 400Gb/s InfiniBand端口(或4096個NDR200端口),雙向總吞吐量達到1.64 Pb/s,是上一代HDR InfiniBand模塊化交換機系列的5倍。相比上一代,這款2048端口交換機的擴展能力增加了6.5倍,採用DragonFly+網路拓撲,只需三個網路Hop就能連接超過一百萬個節點。第三代 NVIDIA SHARP 網路計算數據歸約技術,比上一代的AI加速能力提高了32倍,可大幅提升高性能產業和科學應用的性能。
Magnum IO GPUDirect Storage提供GPU記憶體和存儲之間的直接記憶體拜訪,實現了優異的龐雜工作負載處理性能。這條直接的通路讓應用程序從低I/O延遲中受益,並能夠充分利用到網卡的全部頻寬,同時減少CPU在通訊中的負載,並可以管理逐漸增加的數據消耗所產生的影響。
英偉達表示,目前,已有數十家合作夥伴將NVIDIA HGX平臺用於新一代系統和解決方案,其中包括源訊(Atos)、戴爾科技(Dell Technologies,)、慧與(Hewlett Packard Enterprise )、聯想(Lenovo)、Microsoft Azure以及NetApp等。
英偉達創始人兼CEO黃仁勛表示,HPC 革命始於學術界,並迅速擴展到各行各業。產業各項關鍵趨勢正在推進超指數、超摩爾定律的發展速度,使HPC變成各行業都能使用的工具。
在ISC 2021發布的全球最強系統TOP 500榜單中,有342個系統採用了英偉達技術提供加速,其中包括70%的新系統,與排名前10的8個。英偉達表示,該榜單顯示出越來越多的高性能計算中心在使用AI。例如,榜單上使用 InfiniBand 的系統數量比去年增加了20%。隨著AI、HPC和模擬數據對於低延遲和加速的需求日益增加,InfiniBand已成為首選網路。
此外,名單上的兩個新系統便是英偉達所稱的超級雲——一種新興的共享超級計算機,能夠同時滿足人工智慧、高性能計算和雲端的需求。
微軟Azure利用集群將公有雲服務提升到一個新的水平,在TOP500榜單上延續占據第26位到第29位。 它們是超級雲的一部分,是一臺全球的人工智慧超級計算機,如今地球上的任何用戶都可以按需使用。Azure系統便是英偉達首席執行長黃仁勛所述「行業高性能計算革命」的一例,即AI與高性能計算和加速計算融合,正在推進科研和行業各個領域的發展。
高性能計算正在經歷多米諾骨牌效應,這種效應始於幾十年前通常在學術研究中心進行的
模擬。此類實驗室研究工作吸引了航空太空、醫療健康等多個行業的注意,但他們發現,
這些研究對於其需要的各種巨量計算來說不切實際,直到後來加速計算和深度學習出現,人們才重新看到曙光。
黃仁勛在為法國Teratec活動致辭時表示:「當我們聽到數字生物學革命、未來工廠革命或數字孿生革命時,同樣的基本動態因素也在發揮作用。」這場行業高性能計算革命將席卷數據中心、公有雲和混合雲以及邊緣網路。
(校對/Sharon)