尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
超算,超級計算機,是所有計算機中運算速度最快、性能最強的一類,在科研和軍事等尖端領域擁有舉足輕重的地位,是綜合國力的體現,堪稱國之重器。
或許這些高尖端的龐然大物距離我們尋常百姓的生活很遙遠,所以我們甚至無法感知到它們的存在。但近期一些事件和一些消息則刺痛了很多國人的神經:美國最 新髮布「Summit」超級計算機在時隔五年之後,終於從中國的「神威·太湖之光」手中奪回「世界第一超算」寶座。
美國「Summit」重奪世界第一超算寶座
what?我們居然在這麼高尖端的領先過美國長達五年之久?一些小夥伴看到這則消息時或許會有這樣的感嘆。沒錯,答案是肯定的。出於好奇,筆者順著這條新聞線索在這個陌生的領域找到了很多有趣的數據和有意思的故事,不敢獨享決定梳理出來分享給大家。
單個Summit超算服務器的內部結構
借著Summit這個狠角色,我們先來進行一些科普小知識,超算究竟擁有如何驚世駭俗的計算能力呢?
Summit超級計算機由IBM主導完成,整個超級系統由4608台計算節點,每個節點包含2個22核IBM Power9處理器(負責協調)和6個NVIDIA Tesla V100圖形處理單元加速器(負責計算),並可提供每秒高達20億億次的浮點運算速度峰值!
27648枚NVIDIA Tesla V100 GPU核心提供超強算力
那麼,該如何理解這個每秒20億億次浮點運算呢?如果以我們常見的筆記本電腦為參照物的話,Summit超級計算機的運算能力相當於100萬台筆記本;假如一個人每秒可進行1次運算,他需要活到63億年以上才能與Summit的每一秒運算量相當。
美國橡樹嶺國家實驗室官員站在Summit前
算力驚人Summit自然也是個大家夥,4608個節點每個都有如冰箱大小,總重量高達340噸,它被放置在將近900平米的一個超大房間內,據稱連接這些節點的線纜就有接近300公里的長度。
由於算力驚人自然,發熱量自然巨大,因此全部採用水冷的散熱方式。Summit每運行1分鐘,就需要1.5萬升冷卻液的流量,而它消耗的電量足以為超過8000個美國家庭提供照明。
中國的超算水平處在什麼段位?
對於全球超級計算機的排名情況,全球有一個比較公認的「TOP500」榜單,這是由國外權威的超算專家聯合編制,在全球具有較高的公信力。
在2018年度「超算TOP500榜」中,美國IBM最 新髮布的Summit和Sierra已經分列榜單的冠第1和第3名,而此前蟬聯多年榜首的中國的「神威·太湖之光」和「天河2號」已經下降至第2和第4名的位置。
全球超算TOP500榜前十位
而如果你仔細查看這個榜單的話,你會發現他們的排名是按照Rmax(實測峰值)和Rpeak(理論峰值)來進行排序。而對於任何一台計算機而言,Rpeak理論性能更多的是一種參考,Rmax實測性能則顯得更為關鍵,即使是超級計算機也是如此。接下來我們將範圍縮小至TOP5,看看這些世界頂級的超級計算機究竟在實力上有多大差距。
全球頂級超算TOP5實力排名
此前榜單的頭把交椅由中國的神威·太湖之光把持數年,美國在五年之後發布Summit,重新奪回第一個寶座。從數據來看,Summit的實測峰值比神威·太湖之光高出了31%左右。由於我們採用實測峰值數據來進行比較,再考慮到兩者創建時間的差別,因此兩者的實際差距其實並非像有些媒體宣稱的那樣近乎倍數的懸殊差距。
中國超算實力規模依然全球最強
接下來這組數據將會更加有趣,此前有媒體把TOP500榜單中的所有超級計算機進行了國別的歸類,發現來自中國的超算上榜206台,比例高達41%。來自美國的超算上榜124台,比例是25%,中美兩個超級大國統治了全球超過65%的超級計算機,雖然個體被美國超越,但中國超算的規模仍為全球當之無愧的第一。
那麼問題來了,中國如何再次超越美國Summit重奪全球超算性能第一的寶座?有的小夥伴說堆更多的處理器就好了?然而真實情況卻並非這麼簡單!
真相並沒有這麼簡單!
構建一整套全球頂級的超算系統並非是單純的堆砌處理器這麼簡單,首先要有足夠強悍的計算個體晶片、先進的運算管理技術、操作系統的支持,以及足夠的財力支持才能夠造的出。
當然這一切的背後,最核心的因素是還要有國家層面的政策扶持,以及足夠的尖端科技人才儲備。所以說,超算是一個國家綜合實力的體現一點也不為過。
中國天河二號超級計算機
大陸的超算起步比較晚,但是進步神速,這和大陸高速發展需求和國家政策支持有著密不可分的關係。中國的天河二號超級計算機曾經6次蟬聯世界超算TOP500冠軍,確立了中國在全球超算中的絕對地位。
但是由於天河二號早期使用的是intel Xeon的晶片方案,引來了一些質疑和非議。中國超算的快速崛起也使得美國政府在2015年頒布了引發轟動的「限售」事件:美國政府嚴禁intel等公司向中國四家超算中心出口高性能計算晶片。
國產Matrix-2000加速器替代intel Xeon
最近中美貿易摩擦和中興事件讓中國「芯」提升到了國家戰略的高度,其實在很多年以前美國就已經對大陸的高尖端晶片領域進行「技術封鎖」。
2015年美國「限售」事件爆發,中國決定採用國產晶片替代。直至2017年9月份,廣州超算中心宣布年底前升級天河2號超算系統,使用國產加速器Matrix-2000取代原本的Intel Xeon Phi加速器。通過國產晶片升級後的天河2A超級計算機取得了算力翻倍的驚人成績。
國產Matrix-2000賦予天河2A性能翻倍的
國產Matrix-2000的出現打破了美國的「技術封鎖」,升級後的天河2A超級計算機的浮點性能從之前的54.9PFLOPS提升到了94.97PFLOPS,互聯與I/O方面性能指標也獲得了較大幅度的技術進步。
網路帶寬從原來的10Gbps升級到了14Gbps,延遲從1.57us降至1us,記憶體容量從1.4PB升級到了3.4PB,存儲容量從12.4PB升級到了19PB,帶寬翻倍到1TB/s,而功耗則從17.8MW降至16.9MW,能效大幅提升。
天河2A超級計算機做到國產晶片替代
略帶神秘色彩的Matrix-2000晶片是由國防科大自主研發設計,網傳由天津邁創公司出品。在中國超算白手起家的內憂,疊加美國「禁售」的外患的大背景下,中國超算憑借自主研發的Matrix-2000做到「絕地反殺」,此舉無疑可以載入史冊。
自中國863計劃實施以來,超級計算系統的研發受到了國家的高度重視,但由於基礎薄弱起步較晚,在國際舞台中一直受制於人。美國商務部2015年實施「禁售」高端晶片事件爆發,更是堅定了大陸高端晶片自主研發的路線,並被提升到國家戰略高度。中國目前最強大的超級計算機——神威·太湖之光就是在這樣的背景下誕生的。
再次做到超越的神威·太湖之光超級計算機
神威·太湖之光超級計算機安裝了40960個中國自主研發的「申威26010」眾核處理器,該眾核處理器採用64位自主申威指令系統,峰值性能為12.5億億次/秒,持續性能為9.3億億次/秒。
2016年,國際TOP500組織發布的榜單顯示,「神威·太湖之光」超級計算機系統登頂榜單之首, 不僅速度比第二名「天河二號」快出近兩倍,其效率也提高3倍。
神秘的申威26010眾核處理器
申威26010眾核處理器採用64位自主申威指令系統,峰值性能3.168萬億次每秒,核心工作頻率1.5GHz。「神威太湖之光」里安裝有40960個這樣的處理器。使用中國自主晶片製造的「神威太湖之光」取代「天河二號」登上榜首,中國超算上榜總數量也有史以來首次超過美國名列第一。
申威26010眾核處理器的出現基本做到了對Intel Xeon Phi加速卡的替代。雖然在單片的性能上仍舊跟Intel Xeon存在性能上的差距,但是得益於體積和功耗上面的優勢,可使得一個小小的機箱就可放置256個計算節點,同體積計算性能反殺Intel Xeon Phi。
某專題片對申威26010的報導
相比其他國產晶片,申威則要顯得更加低調和神秘一些,因為申威處理器自誕生之初就背負著軍工國防和國家信息安全的使命,其研發單位總參謀部第五十六研究所(無錫江南計算技術研究所)於2003年開始著手設計中國人自己的高性能晶片。在國家”核高基”重大專項支持下,申威處理睬用自主指令集開發,且具有完全自主知識產權。
天河三號超級計算機有望2020年研制成功
雖然目前大陸兩台重量級超級計算機「神威·太湖之光」和「天河2A」被來自美國的「Summit」和「Sierra」所超越,但兩強交手互有勝負也在情理之中。
據最新的消息顯示,大陸「天河三號」目前正在積極的研發大眾,並有望在2020年重新奪回第一寶座,並做到對「神威·太湖之光」高達八倍的性能超越。更加值得期待的是,「天河三號」有望採用全自主創新設計,自主飛騰CPU、自主天河高速互聯通信,以及自主麒麟操作系統。
然而我們必須清醒的意識到,在晶片領域我們所面臨的對手是如此強大,無論IBM、intel、nVIDIA任何一個晶片公司都具有足夠強大的實力。
同時需要特別注意的是,早在5年前,美國政府就已經停止為超級計算機項目的讚助撥款。轉而開始大力投資量子計算機的研發工作。這也是此前美國超級計算機止步不前,最終被中國一舉超越的重要原因。
擺在國產晶片面前的挑戰和使命同樣重大,在當前的國際局勢下,唯有堅定的走自主研發的道路,徹底擺脫受制於人才是唯一出路。無論是2020年即將投入使用的「天河三號」,還是「神威·太湖之光」後續的升級,在關乎國家經濟命脈和信息安全的超級計算機領域,國產晶片將會愈發壯大,讓我們拭目以待!