尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
最近,新一期全球超級計算機500強榜單面世。來自日本的超級計算機「富嶽」打敗了延續兩年蟬聯冠軍的Summit,僅半成品算力就超Summit一倍多。富嶽搭載的便是ARM架構,這是首次有ARM架構的超算登上Top10,ARM IP產品事業群總裁稱此為「里程碑式的事件」。
在Top500中,有333臺將近2/3的比例,採用了英偉達技術,而在三年前,這一數字還只有203,不到Top500的一半。
編譯| 機器之能
最近,新一期全球超級計算機500強榜單面世,前十榜單如下:
Top500榜單始於1993年,每半年發布一次,重在考核全球超級計算機運算速度。前十榜單中,中國超算有兩臺,來自國家並行計算機工程與技術研究中心的神威·太湖之光和來自中國國防科技大學的天河2A,分別排在第四和第五。美國排名前十超算有3臺,來自IBM公司的「頂點」Summit、 Lawrence Livermore國家實驗室的Sierra以及NVIDIA的Selene。除此之外,榜單的前10位還出現3臺超算新面孔:排名第6的HPC5,由義大利能源巨頭Eni出資研制;排名第7的Selene,由英偉達首次推出,搭載了AMD EPYC處理器+最新的A100GPU;排名第9的Marconi-100,部署在義大利計算中心。從整體榜單來看,中國超算系統上榜數量依舊位居榜首,有226個,美國以114個系統數量排名第二,但美國系統總算力更加強大,總共有644 petaflop,優於中國的565 petaflop。處理器方面,英偉達出鏡率最高,TOP10的超級計算機中有6臺採用了英偉達技術,英特爾其次,搭載其技術的超算有4臺。與以往相比,今年榜單最大的變化就是來自日本的富嶽(Fugaku)登上了榜首,過去幾年中榜首都是由中美兩國超級計算機輪流擔任,從2018年上半年開始,來自IBM公司的超級計算機「頂點」(summit)一直位列第一,延續兩年蟬聯「速度最快超算」,但富嶽的出現打破了這一神話。此外,榜單顯示英偉達 GPU和中國制造商也深受超算系統喜愛。中國制造商在安裝數量中占主導地位,其中聯想、蘇貢和浪潮三家廠商在500套系統中占312套的制造份額。配備英偉達GPU或Mellanox的系統有333套,占據了榜單的三分之二,而3年前這一數字還只是203,不到整個榜單的一半。
一
時隔九年再登榜首,日本率先邁入E級超算領域
由日本理化研究所和富士通共同研制的富嶽成為了該榜單的最大贏家,以415.5 petaflops,即每秒41.55億億次的速度擊敗了延續兩年霸占榜首的summit,後者的算力為148.8petaflops,不到富嶽的1/2。
(富嶽超級計算機/圖源:神戶新聞)按照理論上的最高值,富嶽的計算速度將達到每秒53億億次,是「頂點」的兩倍以上。53億億次是什麼概念呢?
「相當於全球70億人每秒計算1次,還得延續計算兩年以上」。此次Top500的平均算力直接從去年的1.65 exaflops增長到1.65 exaflops,很大程度上要歸功於富嶽。
另外,富嶽同時還在注重超算應用性能的基準測試HPCG和注重人工智慧超算性能的基準測試Linpack「HPL-AI」兩項補充指標中排名第一,也是Graph500榜單的第一。
與追蹤浮點運算能力的Top500榜單相比,Graph 500是利用圖論模擬超算在分析數據密集型應用時的性能,強調記憶體寬帶和延遲,側重於大數據分析等領域的計算能力比拼。更為恐怖的是,這個一連拿下四項冠軍,算力超強的富嶽還只是一個「半成品」。根據富士通和日本理化學研究所的介紹,富嶽還沒有徹底完成開發工作,預計2021年4月開始全面運行,最終版本的峰值浮點性能可達1000PFLOPS(百億億次)。
這意味著,富嶽可能是首個進入E級(百億億次)超算領域的超級計算機。E級計算是中國、美國、日本等正在追求的HPC技術高峰。中國已經超前布局了神威E級原型機、天河三號E級原型機和曙光E級原型機,富嶽的出現,代表日本在這個率先邁出了第一步。
目前中國的聯想已聯合全球HPC領域一些知名企業,創建「E級計算願景委員會」,致力於解決技術難題,使E級,也就是百億億次每秒運算能力的超級計算機推廣到全球。
日本資金實力並不算強勁,在超算競爭中長期落後於中美,一鳴驚人的富嶽究竟是什麼背景?
富嶽並不是日本超級計算機首次奪冠,九年前同樣來自日本的超級計算機「京」以8162億次的運算速度奪得top500榜首,富嶽正是京的「繼承者」,在架構上多得益於之前的京超算,也同樣是日本理化研究所和富士通共同研制的結果。日本理化研究所(RIKEN)本身背景非常強大,由有「日本資本主義之父」之稱的澀澤容一設立於1917年。超算系統作為「國之重器」,理化研究所對其投入了相當多的人力和資金,據Satoshi Matsuoka,富嶽系統的造價高達1100億日元,折合人民幣72.7億,比天河二號和神威·太湖之光貴了好幾倍。
二
「ARM CPU性能先天強過x86 CPU」
與富嶽奪冠同樣令人關註的還有其搭載的ARM架構。富嶽超級計算機採用了富士通設計的A64FX SoC,該SoC採用48顆ARM核心的配置,浮點部分是與ARM合作的SVE指令擴展,使用了512bit浮點運算單元,每個節點使用48核+4輔助核,IO及計算節點則是48核+4輔助核結構。而該超算一共搭載了158,976組這樣的SoC。這是首次有ARM架構的超算首次登上排行榜前十,並且還是登上了首位。兩天前蘋果恰好官宣在Mac上使用基於ARM架構的自研晶片,看來ARM很有一統IP江湖的趨勢。需要指出的是,ARM架構在超算系統中的確隻占很小的一部分,Top500中只有4個採用ARM架構,其中3個用富士通設計的Fujitsu A64FX處理器,另一個用Marvell的ThunderX2。雖然數量少,但這對ARM來說就已經是不小的突破一直以來,ARM在很多人眼裡雖然占據移動晶片大半壁江山,但與高性能晶片無緣,超級計算機等對算力要求高的系統還是X86的天下,但ARM在富嶽上的使用無疑是一個信號,證明了ARM高性能計算的可能性,ARMIP產品事業群總裁Rene Haas甚至用「里程碑式的事件」來形容:「看到如此規模的 ARM 架構超級電腦成型,讓我們感到極為驕傲,我們感謝 RIKEN 與富士通的奉獻與合作,感謝他們向世界展示了基於ARM的高性能計算的可能性。」「驅動全世界速度最快的超級電腦,是值得我們整個生態系慶祝的里程碑,因為它在相當程度上證明 ARM平臺背後的能效、性能和可擴展性,已對整個基礎架構與高效能電腦(HPC)帶來意義重大的影響。」事實上,ARM很早就開始尋求將高性能計算領域擴展的機會,2016年便研發出了ARMv8-A可伸縮矢量擴展(Scalable Vector Extensions/SVE),專為高性能計算、數據中心而生,SVE作為ARMv8-A指令集的可選擴展,支持最低128-bit、最高2048-bit。同年富士通簽下了ARMv8-A SVE的授權,富嶽正是搭載了該SVE。同年ARM並購了為超級計算機提供性能分析工具的Allinea Software公司。2018年,美國桑迪亞國家實驗室宣布交付了基於ARM處理器的超算Astra,於11月躋身Top500列表。2019年,ARM在高性能計算領域邁出了重要的一步——英偉達宣布CUDA支持ARM CPU,用於構建極高能效水平的的百萬兆級AI超級計算機,此前英偉達也已經在遊戲、自動駕駛、機器人和嵌入式AI計算系統級晶片中採用了ARM。此外,歐洲處理器計劃、美國能源部先鋒項目等眾多超級計算機項目都在尋求Arm的加入。為什麼超算中心都瞄準了ARM?
英偉達Tesla營銷總監Sumit Gupta曾在一次採訪中表示,「ARM CPU性能先天強過x86 CPU,因此更適合用於未來的高性能計算。」
他認為,ARM架構興起於嵌入式領域,功耗限制很流行,不足1W被認為是正常狀態。性能從晶片的概念設計階段就受到限制,迫使工程師必須在能效比上特別創新。而英特爾和AMD的x86架構則從PC的角度進行考慮,機器通常接入電源,沒什麼嚴苛的功耗限制。
所以「x86系統唯一的真正優勢是能夠在微軟Windows等系統上運行的更快,但若需在最小功耗下取得最高性能,ARM才是未來的選擇,因此它也是超級計算的最佳選擇。」
三
占比超2/3,為什麼超算越來越喜歡英偉達?
ARM之外,Top500榜單的另一個讓人關註的點是英偉達。Top10的超級計算機中有6臺採用了英偉達技術,或同時採用了兩種技術,Top500中,有333臺,將近2/3的比例,採用了英偉達技術,而在三年前,這一數字還只有203,不到Top500的一半。
其中由英偉達內部研究出的超級計算機Selene在Top500中排名第7,在注重能效比的Green500榜單中位居第2,比Top500中未使用GPU的超算系統平均表現高出了6.8倍。為何用英偉達系統的超級計算機越來越多了?其GPU的恐怖算力已經無需贅述,三年前推出的V100用 300W 功率提供了 7.8TFLOPS 的推斷算力,而今年剛剛發布的A100算力是前者的20倍,強大到恐怖的算力非常適用於超級計算機。另外,新推出的第三代 Tensor Core處理速度更快、更靈活,其功能經過擴展後加入了專為AI開發的全新TF32,將AI性能提升了20倍,擁有更好的能效比,Selene的成就就是一個鮮明的例子。卓越的能效比也是超級計算機看中英偉達的原因之一。最後,今年4月,英偉達以69億美元天價收購了以色列「服務器和存儲器端到端連接解決方案領先供應商」Mellanox,致力於InfiniBand和以太網互聯產品的研發。InfiniBand互連是一種低延遲結構,它可以大大減少計算節點相互通訊所需的時間,大規模用於超級計算機和超算平臺。如今,TOP500榜單上有將近四分之三(74%)的全新InfiniBand系統採用了NVIDIA Mellanox HDR 200G InfiniBand。很大程度上,收購Mellanox是其產品在Top500榜單中迅速提升的關鍵。
四
結 語
最後,這份Top500榜單,尤其是新登頂的富嶽或許也反應出了一個趨勢,超級計算機越來越注重應用了。
關於富嶽的介紹都特別強調了其應用落地的廣泛性和對實際生活的助益。富嶽已安裝在日本神戶理研計算科學中心(R-CCS)中,旨在優先的社會和科學問題。目前,富嶽已經在實驗用於COVID-19的研究,包括病毒傳播的診斷、治療和模擬,例如模擬因噴嚏、咳嗽和說話等產生的飛沫如何擴散來預測COVID-19傳播軌跡。未來富嶽也將用於藥物研發、預防醫學、模擬自然災害、天氣預報、清潔能源發展等領域。
(富嶽的飛沫研究/圖源:NHK)
其餘Top10計算機也各有其應用領域,比如submmit落地重在AI方向,允許研究人員將機器學習和深度學習應用於人類健康、高能物理、材料發現以及其他技術的相幹問題中。與之相比,我國超級計算機「重研發,輕應用」,大家經常談起超算的性能如何,能效比如何,但鮮少談及落地在哪裡。中科院計算所研究員張雲泉最近在報告中提及,我國超算的建設思路是系統性能優先發展,再拉動超算應用發展,而歐美日等國家一般根據各領域實際應用需求,針對性地研制能滿足實際應用需求的超算系統,以避免對機器的浪費。「雖然在過去二十多年裡,我國超算的研制和發展取得了輝煌的成績,但為了取得TOP500世界冠軍而忽視實際需求,研制遠遠超過實際需求的機器的做法,也越來越值得我們反思。」
中國AI公司首批上市潮來襲2020-05-25
華為颶風過境,臺積電何以成為中心眼?2020-05-18
從典范走向幻滅:Google13億元的智慧城市夢2020-05-10
文章已於修改