尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
摘要:雷鋒網認為,競爭激烈的程度更多會取決於科技巨頭,由於他們對自己的業務和數據有更深的理解,他們定制化的ASIC晶片更容易達到性能和能效的最優。即便自研的AI處理器性能弱於晶片巨頭的產品,如果科技巨頭出於自主可控的考慮,用自身的業務和場景去支撐自研晶片的迭代和優化,為此付出一些代價,最終也能研發出在特定領域非常具有競爭優勢的晶片。
2019年杭州雲棲大會上,阿里首款AI晶片含光800雖然只有短短幾分鐘的介紹,卻成了外界最為關注的消息。互聯網巨頭進入自研晶片領域早已不是新聞,但每次他們自研晶片的正式推出和商用的宣布,依舊會吸引了無數的關注。
不少人應該也會疑問,這是不是晶片巨頭們要被替代的開始?
互聯網巨頭造芯的初衷
在互聯網企業造芯的路上,Google跑在了最前面。早在2006年,Google就開始考慮在其數據中心部署 GPU或者 FPGA,或專用集成電路(ASIC),當時的結論是,能在專門的硬件上運行的應用並不多,使用Google大型數據中心的富餘計算能力即可。
情況在2013年發生了轉變,當時Google用戶每天使用語音識別 DNN 語音搜尋三分鐘,使得Google數據中心的計算需求增加了一倍,而如果使用傳統的 CPU 將非常昂貴。因此,Google啟動了一項優先級別非常高的項目,快速生產一款定制晶片(ASIC)用於推理,並購買現成的 GPU用於訓練。
Google的目標是將性價比提高 10 倍,為了完成這項任務,Google在其數據中心設計、驗證、構建並部署了 TPU(張量處理器,Tensor Processing Unit),這一過程用了15個月。
2016年,GoogleI/O開發者大會上,Google正式發布了首代TPU。不過,TPU剛開始只僅限Google內部使用,直到2018年2月,Google才在其雲平台博客上宣布TPU服務開放的消息,價格大約為每雲 TPU 每小時 6.50 美元,而且數量有限。
也就是說,2018年,Google才開啟了TPU的商業化。同年的I/O大會上,TPU 3.0宣布推出,計算性能相比TPU 2.0提升八倍,可達 100PFlops(每秒 1000 萬億次浮點計算)。
可以明確,GoogleTPU的推出,主要還是因為市場上沒有滿足其需求的晶片,使得他們進入了自研晶片領域,並且,TPU作為雲端推理晶片並不對外出售,而是通過Google雲對外提供算力。
阿里的自研晶片之路與Google類似。1999年以淘寶起家的阿里,如今的業務早已橫跨電商、金融、物流、雲計算、大數據、全球化等場景。不同的場景就有不同的計算需求,比如淘寶里的拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時。除了需要花費1小時的時間,這個時間里GPU的耗電量也非常巨大。
雷鋒網 (公眾號:雷鋒網) 此前報導,數據統計顯示,2017年中國有40個中小型數據中心,這些中小數據中心2017年消耗電量比三峽大壩的發電量還多,等量的碳排放量兩倍於民航的碳排放量。對於阿里和Google這樣擁有大型數據中心的科技公司,電量消耗也帶來了巨大的成本。
如果Google和阿里想要通過購買算力更強的最新款英偉達GPU來提升效率,GPU高昂的售價也是科技巨頭們無法忽視的問題。
因此 阿里也開啟了自研晶片之路。2017年的雲棲大會上,阿里宣布成立達摩院, 由全球建設的自主研究中心、高校聯合實驗室,全球開放研究計劃三大部分組成,涵蓋量子計算、機器學習、基礎算法、網路安全、視覺計算、自然語言處理、下一代人機交互、晶片技術、傳感器技術、嵌入式系統等,涵蓋機器智能、智聯網、金融科技等多個產業領域。
2018年雲棲大會,阿里又宣布成立獨立晶片企業「平頭哥半導體有限公司」,由中天微與達摩院晶片團隊整合而成。
還是雲棲大會宣布者還是張建鋒,2019年阿里首款AI雲端推理晶片含光800正式推出。在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI晶片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
性能提升帶來的效果顯而易見,繼續用上面的拍立淘舉例,阿里表示,採用含光800後,每天新增10億商品圖片的識別時間可以從GPU識別的1小時,可縮減至5分鐘。另外,根據雲棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。
由此做一個簡單的換算,那就是1個含光800的算力等於10個GPU。
相比Google遲遲沒有商用TPU,阿里在發布含光800之時表示這款產品已經已經做到了大規模應用,應用於阿里巴巴集團內多個場景,例如視頻圖像識別/分類/搜尋、城市大腦等,並且 宣布基於含光800的AI雲服務也正式上線。
顯然,阿里自研AI晶片最核心的目標同樣是為了獲得更低的經濟成本。
科技巨頭與晶片巨頭不再只是合作
由此看來, 目前阿里和Google商用的自研AI晶片都是雲端推理晶片,對於傳統晶片巨頭英特爾和英偉達而言,這並不會帶來巨大的改變,但雙方的關係會從此前緊密合作變為競合關係。
如何理解?雖然有了面向視覺場景的含光800推理晶片,但是這是一款ASIC晶片,其定位也是CNN類模型推理加速為主,通用可擴展到其它DNN模型。但對於更多的深度學習算法,含光800這款ASIC可以在一定支持,但無法體現出性能和能效最優化。
所以,無論是阿里還是Google,他們依舊需要英特爾的CPU提供通用的計算能力,也需要FPGA進行AI的加速。另外,阿里性能強大的神龍架構服務器,也需要英偉達GPU提供算力。
這種競合關係不僅會局限在雲端。2018年7月,Google推出Edge TPU晶片,從命名上就可以看出這是此前推出的雲TPU的簡化版本,是專門設計的加速器晶片,用於在邊緣運行TensorFlow Lite機器學習模型。
英雄所見略同,阿里也有端雲一體的戰略。在含光800雲端AI晶片發布之前的7月和8月,阿里接連發布了高性能RISC-V架構處理器玄鐵910以及SoC晶片平台「無劍」。也就是說,阿里的C-Sky系列、玄鐵系列AIoT終端晶片IP,一站式晶片設計平台無劍,以及最 新髮布的雲端AI晶片構建了阿里端雲一體的晶片生態,平頭哥端雲一體全棧晶片產品家族雛形已現。
另外,2019雲棲大會期間還有一個晶片的重磅宣布,阿里人工智能實驗室和平頭哥共同定制開發的智能語音晶片TG6100N,會在即將推出的音箱產品中使用。
科技巨頭們的自研AI晶片要涵蓋雲端和終端其實也很容易理解,無論是晶片巨頭還是科技巨頭,他們都認為未來數據將像石油一樣具有價值。因此,巨頭們需要端雲一體的戰略挖掘數據的價值,在數據的時代保持領先,而這個戰略非常重要的支撐就是雲端和終端的AI晶片。
此時科技巨頭和晶片巨頭都會有雲端和終端的AI晶片,競爭就難以避免。 雷鋒網認為,競爭激烈的程度更多會取決於科技巨頭,由於他們對自己的業務和數據有更深的理解,他們定制化的ASIC晶片更容易達到性能和能效的最優。 即便自研的AI處理器性能弱於晶片巨頭的產品,如果科技巨頭出於自主可控的考慮,用自身的業務和場景去支撐自研晶片的迭代和優化,為此付出一些代價,最終也能研發出在特定領域非常具有競爭優勢的晶片。
注意,科技巨頭們會在與自己業務和生態相關的領域自主研發AI晶片。但如果想要替代現有的成熟晶片,比如英特爾的至強CPU和英偉達GPU,既沒有價值也面臨巨大的風險。 歸根結底,科技巨頭們自研AI晶片的初衷是為了獲得更大的經濟效益,通過自主研發的晶片保持其技術和生態的領先性。同樣,他們的自研晶片也更多的會服務於自己的業務和生態,而非搶食晶片巨頭們的市場。
雷鋒網小結
AI時代,科技巨頭們與晶片巨頭們不再只是緊密的合作夥伴,也會在特定領域成為競爭對手。也就是說,對於晶片巨頭們而言,想要在科技巨頭擁有自研晶片的領域獲得訂單,需要付出更多的努力。
反過來,晶片作為一個技術、資本、人才都密集的行業,其長周期的特點也與互聯網和移動互聯網快速迭代的模式不同,如何找到軟硬之間的最佳平衡點,以及如何與晶片巨頭們多年在晶片領域積累的優勢競爭,也都是科技巨頭自主研發晶片面臨的挑戰。
相關文章:
雲棲大會 | 阿里宣布全球最強AI推理晶片含光800問世,張勇、張建鋒大談數字經濟
阿里首款AI晶片含光800重磅發布,全球最強AI推理晶片如何練成?
雷鋒網原創文章,未經授權禁止轉載。詳情見 轉載須知 。
>阿里和Google自研AI晶片商用,科技巨頭與晶片巨頭關係生變