搞AI框架那幫人（二）：賈揚清與阿裡靈傑

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接❤️

加入LINE好友

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第1張

圖片來源@視覺中國

文 | 親愛的數據，作者 | 譚婧

文 | 親愛的數據，作者 | 譚婧

在人工智慧（AI）的江湖，常聽人言：得框架者，得天下。

誰主宰AI模型的生產自動化，誰最有可能主宰AI工業化。所以，深度學習框架是科技巨頭兵家必爭之地。

深度學習框架屬於AI框架，是AI底層技術，而AI技術創新早已深入底層。沒有什麼道路可以通往底層技術創新，底層技術創新本身就是道路。

這條路，是隱秘的，深度學習框架作為AI系統軟體，走近前去，才不斷驚嘆它那種躲躲藏藏的寬闊；走進前去，才不斷驚嘆戰壕密布，戰馬喧騰。

低垂的果實已摘光，那些隻消小打小鬧（對人工智慧模型做一些小調整，擴大人工智慧模型的規模）就能刷論文、刷面子、刷一切的日子，一去不復返了。

從歷史中得到的唯一教訓，就是從未從歷史中得到教訓。而人工智慧算法不同，偏偏擅長從歷史中「得（學）到（習）」。

回顧從前，多款深度學習框架，待時而出，常聽人言：為什麼，這個深度學習框架受人追捧，那個深度學習框架遭人嫌棄？

賈揚清認為：「這背後是AI需求和設計邏輯的變化。」

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第2張

像深度學習框架這樣的計算機系統軟體，大型項目經驗被極客們追奉為信仰，而賈揚清是開源軟體深度學習框架Caffe，Caffe2的作者，是Google深度學習框架TensorFlow的核心作者之一，親手寫了ONNX初版代碼。

一位技術大神可以是一個深度學習框架的作者，很難是全球流行深度學習框架的作者，極難成為多款全球大流行的深度學習框架的作者。

伸手一數，這個年齡段，這個履歷表，放眼全球，除了賈揚清，很難找到第二人。

02 一時，性能是第一需求

車輪破開積水。

開場白，在雨中。撐著傘，邊走邊聊，賈揚清說：「對於技術來說，有一句話很重要，There is no stupid people, only misaligned priority（沒有蠢人蠢事，只有搞錯了的優先級）。」

深度學習框架的發展是螺旋式，談論深度學習框架，繞不過它所解決的核心問題。某一段時間內，性能是第一需求；過一段時間，靈活又會變成第一需求。敲黑板，請記住「第一需求」。

搞人工智慧，首先氣質這塊要跟上，手推公式，一面牆寫滿密密麻麻的公式，頓時身高一米八，氣場八米一。

搞人工智慧，其次能力這塊要跟上，機房裡動不動就是計算集群，一臺計算機解決不了，一百臺計算機合力上。一頓操作猛如虎，效率還在原地杵，那可是饒君掬盡湘江水，難洗今朝滿面羞。

搞人工智慧，光會數學不夠，還要懂計算機，動不動赤手空拳面對一群計算機。雖然不是打群架，但也難敵成千上萬張顯卡，性能、資源、頻寬、訪存、大規模分布式系統，一個都不能少，都要搞定。

搞人工智慧，不容易。假設一個工程師這樣開始一天的工作：在計算機上每實現一個AI算法，都要用機器指令控制龐大的計算機系統，全盤考慮計算機底層資源是如何運轉，如何分配的。這還不夠亂，後面還有一千臺計算機在排長隊，看不到隊尾那種。

於是，下班給老板寫了一封辭職信，來男廁所第二個隔間處領取。

眼看著這種困難和龐雜至極的情況，真是聞者傷心，聽者落淚。往嚴重裡說，運算AI算法和計算機的效率上不去，會拖住全球人工智慧產業落地的後腿。

對此，搞深度學習框架那幫人旗幟鮮明地支持AI算法工程師，全神貫註於算法設計和實現，讓深度學習框架解決這個痛點。而那些最先解決痛點的，往往是最先遇到痛點的。

2009年，Google公司率先建了一個框架，名叫DistBelief。

Google公司擅長計算機系統級軟體，它不會放過任何機會。歷史反覆證明，在計算機系統軟體的戰場上，Google沒有輸給過任何公司。跑高鐵，鋪鐵軌，跑算法，就要建框架。於是，Google建了。

如今談起DistBelief，仿佛陳年往事。這個Google公司的閉源框架，從分步式系統設計的角度看，建得非常好。也有人把DistBelief視為TensorFlow的前身。

雖然最開始設計的時候不是專門為卷積網路設計的，但是，DistBelief給當時非卷積的網路架構提供了很好的設計基礎。它的設計原理像大腦，厲害之處在於，那個時候，就能做超大規模的訓練，搞定十億參數。

Google渾涵光芒，雄視千軍，做大型計算機系統軟體，尤為擅長分布式，「大」從來不是問題，就怕不夠「大」。

那時候，中國的新浪微博才剛開始走紅，不像今天「微博輿論」已是大數據。那些AI訓練所使用的數據，像夏汛的河水不斷刷新水位線紀錄。而那時候的深度學習框架，沒有「張量（tensor）」的概念。

曾幾何時，張量是物理學家喜歡的概念，但是數學家會說，我不滿意物理學家對張量的看法。AI算法開發者說：「隻使用，不爭論。」

所有的光芒，都需要時間才能被看到。

2010年，深度學習在語音領域實現了突破，其中沒有用到卷積網路。轉眼一年後，2011年12月29日，一篇論文激起千層浪，一個炫酷黑科技大火了，計算機居然會自動找出貓咪圖片。

這個AI技術，是Google的。讓計算機來回答一張圖片上的動物是不是貓，答案只有兩個，是貓，不是貓。愛貓人士，一片歡騰，人工智慧也愛擼貓，看來普通人和高科技的距離，只有一隻貓。

貓火了，論文也火了，Google也火了一把，只有深度學習框架沒有火。

那篇響當當的論文是在DistBelief深度學習框架上做的。那時候，Google公司就能自信地漫步在深度學習框架上，用成千上萬的CPU核，訓練數十億參數，遊刃有餘地管理底層技術細節。

喵星人是網紅體質，AI也是。

2012年，AlexNet模型一問世就成了網紅，掀起了深度學習在圖像識別上的高潮。這個模型有多重要？此後的大約十年內，有無數雙渴（想）望（發）真（論）理（文）的眼睛都不停放電，不放過任何一點微小細節，哪怕論文裡有些思路已不再適用。

AlexNet模型的背後是圖靈獎獲得者，傑弗裡·辛頓（Geoffrey Hinton），論文的兩位作者（Alex Krizhevsky和Ilya Sutskever）同出一個師門。那一年的國際競賽上，他們的團隊是唯一使用神經網路的團隊。

日後從創業到被Google收購，一路火花帶閃電。

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第3張

Alex是常見英文名，有戰士之意，這個名字的常見程度，類似於中國的「建軍」。為了訓練模型更順暢，建軍博士Alex Krizhevsky手寫了一套深度學習框架，名叫Cuda-Convnet，完全是為了搞科研，順手而做。

起初，建軍博士Alex Krizhevsky搭建了支持快速科研迭代的一套代碼，在GPU上快速跑神經網路。隨後，用比較簡單直接的C/C++代碼和手工定義模型格式，不加入太多大工程的抽象和設計，一切按從簡於易的思路設計。

草率批評的人會說，很難體系化。建軍博士Alex Krizhevsky可能會儒雅地回懟：「奇技淫巧，吾不以為意也。」

深度學習框架Cuda-Convnet的整套代碼，是典型的科研代碼，大牛才能寫出來，缺憾是不重（理）視（睬）工程設計，沒有太關註模塊化和抽象化的能力。那時候，手寫框架大神出手對付科研，足矣。

出生於那個時期的深度學習框架，身上留有「時代的烙印」，天時地利決定了它不是為工業化而生。不能往大處用又怎麼樣？不求孤名做霸王，打遍天下做拳王。

03 Caffe問世，人間值得

夕陽暮火，紐約大學晚風撩人，加州大學伯克利分校晚霞燦爛。

美國紐約大學楊立昆團隊推出的OverFeat深度學習框架，也完全是出於自用，完全以搞科研為目的。甚至連起名字也沒有多費心。OverFeat是一篇論文提到的算法名字，時至今日，再度提起這個框架，有一種考古挖掘的既視感。

從2009年8月開始的四年零五個月裡，賈揚清在美國加州大學伯克利分校讀博士，在計算機視覺小組，他悄然發現Cuda-Convnet是個寶藏，代碼在優化方面寫得特別精妙。

他按捺不住驚喜，找到了建軍博士Alex Krizhevsky，只為此間精妙，哪怕從頭寫一遍Cuda-Convnet全部代碼。

有些問題，早已藏在心底，期待被人問起。作為AI的使徒，建軍博士Alex Krizhevsky心底的問題被賈揚清問到了，Cuda-Convnet是怎麼設計出來的？

建軍博士Alex Krizhevsky的語氣儒雅溫柔：「因為我們成立了科技公司，代碼屬於商業智慧財產權，不能分享代碼，但是，如果有什麼科研實現上的困難，可以隨時問問題。」

為了尊重智慧財產權，除了開源Cuda-Convnet之外的任何一行代碼，都不可分享。但是，智慧和經驗都可分享，一段不限時長的在線Q&A開始了。此後，當賈揚清和團隊遇到困難，就會得到幫助。這是上一代全球流行的深度學習框架Caffe最開始的故事。

一段偉大的旅程，出發時，往往只為實現一個小目標。

那時候，賈揚清的想法很簡單，讓加州大學伯克利分校的隊友們，更容易嘗試花式新算法，跑模型的工作更加體系化。

賈揚清心惟其義，潛心學習了Cuda-Convnet的寫法，主要是學習高性能代碼的設計思路。

他打算重新寫一個框架，實現和Cuda-Convnet一樣的功能，設計地更加體系化，更多工程上的抽象，同時又有完整的單元測試。

有些工作，一旦開頭，就停不下來了。賈揚清和團隊先寫了一個基於CPU的框架，叫Decaf。再寫了一個基於GPU的框架，叫Caffe（C-A-F-F-E這個五個字母，分別是論文「快速特征提取的卷積框架」英文簡稱的首字母），讀音咖啡。

Caffe的論文還對比了OverFeat，Decaf，Torch7，Theano/Pylearn2,Cuda-Convnet這幾位框架界的前輩。

巧合的是，第一眼看到這個開源框架的AI開發者，可能要驚訝到「喝杯咖啡，壓壓驚」。深度學習框架Caffe的出現，方便了萬千AI開發者體系化的開發模型，遠離那本叫做《頸椎綜合症的康復與治療》的破（惡）書（夢）。

說深度學習框架Caffe是許多AI開發者的初戀，並不為過，知乎帖子裡的回憶殺，至今仍有開發者把Caffe的源碼梳理了好幾遍，一種經典永流傳的既視感。

早期計算機視覺創業公司則拿出看性感美女的眼神打量Caffe，一秒鐘也不能等了，立刻上手。誰攔著，就急眼，誰擋著，就拼命。

人頭攢動中，人群高喊：Caffe來啦，快用啊，沒時間解釋了，老司機開車啦。

作為賈揚清創建的開源項目，Caffe由美國加州大學伯克利分校視覺和學習中心在GitHub上一個活躍的貢獻者社區的幫助下，維護和開發。

Caffe出生的時候，賈揚清是博士生，買設備，很摳門，好在英偉達公司捐贈了一個6000美元的GPU，他又去美國亞馬遜網站攢了一個600美元的電腦。大家開玩笑說，這套裝備的淨值是6600美元。

誰能想到，老司機的車，是小馬拉大車。

這不是傳聞，這是賈揚清在Caffe項目上真實的工作條件。直到今日，賈揚清仍然感懷Cuda-Convnet的「功勞」，引用他的原話就是：「特別是一些算子實現，都是受到了它的啟發。」

傳承是一種科學精神，無論後輩致敬前輩，還是前輩關懷後輩，都好似春風拂面，陽光醉人。

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第4張

賈揚清曾在知乎上聊過一個小段子。

美國史丹佛大學著名的李飛飛教授（這位是女神版，阿裡巴巴還有一位男神版）經常關心華人學生。賈揚清在加州大學伯克利分校念博士的時候，有一天，李飛飛教授突然問了賈揚清的導師Trevor Darrell教授一句：「賈揚清這學期沒幹什麼事兒啊！（Yangqingis just doodling around in the last semester!）」

從史丹佛大學到加州大學伯克利分校，開車需要一小時，AI大牛教授洞察一位博士生只需一個念頭。請估算賈揚清的心理陰影面積和感動函數。

那些時光沖不淡、風塵吹不散的日子，偶然念及，歲月靜好，人間值得。

04 吹響軍團作戰沖鋒號

一路奔，一路跑，

深度學習算法豹變，深度學習框架虎嘯。

著名的AlexNet之後，優秀的VGG，GoogLeNet等深度學習算法模型，以山洪暴發之勢，沖刺精確度，橫掃江湖。

建軍博士Alex Krizhevsky有一句著名的玩笑，「用兩個GPU，就超越了Google工作的性能」。讀懂這句的人，無不感慨算法創新的魅力如此之大。

算法強，就能在同等條件或者更少算力的條件下，僅憑才華，以寡敵眾，以窮勝富，以少贏多。然而，深度學習框架那幫人心裡卻在想另一件事，既然算法創新如此迅猛，就得有相應的軟體框架去實現。

那時候，GoogleAI掌門傑夫·迪恩（Jeff Dean）和美國史丹佛大學博士安德烈·卡帕西（Andrej Karpathy）常常叫上精神小夥們，圍桌討論。

這種天才小論壇，在當年，一間屋子也就夠坐了。傑夫·迪恩（Jeff Dean）偏超大工業工程，安德烈側重前沿學術研究。那個時候，這群精神小夥中有很多人還是學生，他們時常討論AI將有什麼樣的創新。

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第5張

有人稱傑夫·迪恩（Jeff Dean）為「姐夫」，是傑夫的諧音，但是稱他為天才並不為過。

安德烈·卡帕西（Andrej Karpathy）則是「全身熱戀」，個人網頁向AI告白「karpathy.ai」「我喜歡在大型數據集上訓練深度神經網路」。

後話是，安德烈·卡帕西（Andrej Karpathy）於2017年離開Google去了特斯拉，同年，建軍博士AlexKrizhevsky也離開Google。

賈揚清做Caffe項目的時候是博士生，周圍很多AI大神也仍在求學。那時候，大家喜歡在性能上比賽，我的性能比你好，你的性能比我好。所以，算得快，很重要。

「自建」深度學習框架時代，「第一需求」是什麼？答案是性能。

縱觀這個歷史時期，深度學習框架先要讓模型性能受益，其他顧不太上。深度學習框架沒有「大一統」，深度學習框架都很簡單，很小。

這好比新石器時代的河姆渡人蓋房子，蓋得簡單，但也可以為原始人遮些風，擋些雨。那時候，哪有毗鄰名校，樓層視野，小區綠化，周邊配套等講究。

憶往昔，搞深度學習框架這群人雕刻靈魂，也雕刻了歲月，他們不急不躁，對AI技術的促進自不用說，對AI產業潛移默化，讓人敬畏。

深度學習框架當中，Theano比較偏向數據科學家的使用，用Python編程語言，用代碼生成模式。而Torch則不同，關註靈活的迭代，用Lua編程語言。

Lua這個語言，小而美，它在遊戲領域很受歡迎，允許與C數據結構簡單接口，隻可惜後來日漸式微了。有不少人很喜歡，用熟了就繼續在深度學習框架中使用。

俗話說，熟土難離。這個細節反映出，那個時代，不爭搶，不內卷，大家都是怎麼熟悉怎麼來，怎麼順手怎麼來。也反映出，Torch從一開始就是重視易用性理念，而不關心新技術思路的實現。

性能為王的歲月，英偉達公司敏銳參與了趨勢，和搞深度學習框架那幫人常有溝通，互幫互助，帶動大家夥為深度學習框架貢獻代碼。

這裡加一個小段子，英偉達的產品線剛剛開始有AI計算的時候，有一個捐贈計劃可以讓賈揚清選兩種GPU。一種僅用於AI計算，不能玩遊戲。另一種，保留了遊戲用途的接口，不僅可以做計算，還可以玩遊戲。當時，賈揚清想也沒想，選了前者。回頭一想，竟然後悔。

cuDNN是英偉達用於深度神經網路的GPU算子庫。如今，已經是各大品牌的深度學習框架都會調用的工具。英偉達先知先覺，Google後知後覺。

2014年前後，深度學習框架DistBelief的設計，不太適合深度學習裡的一種新思路，張量（tensor）。所以，Google內部也持續有討論的聲音傳出來，新的框架應該怎麼做。沒有人明確說他們正在做的，就叫DistBelief 2.0。

如果要寫新的框架，那應該是怎麼個寫法？這個問題成為Google搞深度學習框架的科學家的第一要事。更準確地說，新一套，而不是新一版，邁開大步，換個思路，重新設計。

賈揚清和部分Torch的作者打卡Google後，開心地發現，不少老面孔已經在DistBelief團隊裡了，Google讓開源深度學習框架作者有機會歡聚一堂。

這時候的Google，可謂是，深度學習框架的天下英雄，皆入我營帳之中。於是，Google率先發力，一堆石頭打得紛飛，流星對空亂撞，好一番激蕩。2015年10月，TensorFlow問世了。

人人都知道Google的系統能力獨步天下，但又都想知道，Google公司的系統能力到底有多強？

總體說來，TensorFlow的設計非常有啟發性。可以把TensorFlow理解成為Google軟體能力的綜合體現，既能看到，眾人拾柴火焰高，開源社區中所能見到的，已有的設計思路，都被很好地用了起來，比如說像計算圖，張量（tenor），它是一個集大成者，同時解決了性能和規模化，把分布式也做起來了。

TensorFlow的問世，讓人懷疑Google不是來做產品的，而是來展示實力的。再細測試能力，規模化分布式的能力，都很強，不偏科。

這是一個深度學習框架的里程碑事件，標誌著學術制造（博士生和研究生做框架）的時代，轟然落幕。

那時候參與第一代深度學習框架的人中，有不少搞科研的學生，他們不是師出名門，就是高足弟子，充滿科研熱情。盤點一圈，哪個都非等閒之輩。夜幕降臨，深藍色的星空之下，他們是拓荒者，刀耕火種，圍坐溝火。

這時候，GoogleTensorFlow來了，刀耕火種時代的溝火晚會結束，深度學習框架開啟軍團作戰模式，沖鋒號吹響了。

05 易用和穩定，各登一頂

歲月彌久，夢已七年。

2016年是TensorFlow高速發展的一年，傑夫·迪恩（Jeff Dean）的演講裡，論文引用次數指數級暴漲。

TensorFlow的熱火朝天之中，一個需求像初生嫩芽一樣，從土壤中探出了腦袋，並迅速在開源社區產生集體共識。

TensorFlow難學難用，恰逢其時的是，性能講了那麼長的時間，GPU的計算速度也很快了，高速迭代不需要100%的性能，85%就可以了。這時候，人力成本上升為最大的成本。

開發者拼了命地吶喊：框架得易上手！這個吶喊，是在呼籲易用性。此時的需求明擺著，就是易用。

Torch是火把的意思，易用性點燃了深度學習框架PyTorch的火把，搞深度學習框架那幫人驚訝地發現，烽火連三月，易用抵萬金。

這個讓TensorFlow最忠實的用戶認為最不符合邏輯的地方，一定藏著最深刻的邏輯。時來天地皆同力，PyTorch生逢其時，正巧解決了TensorFlow一個超大痛點。

PyTorch起步比TensorFlow晚，拼資源也不占優勢，Google的資源不比市場上任何一家差。創始團隊思前想後，決定直搗黃龍，這條龍就是易用性。俗話說，寧走十步遠，不走一步險，其他特點不是不重要，而是顧不上，PyTorch團隊孤註一擲，把易用性，打穿，打透。

這種打法，逼著PyTorch隻靠「易用性」這一拳，打出了四海八荒之力。基礎設施投資是巨大的，PyTorch最初的原因是投入少，唯有這種打法需要較少的資源。

這個選擇，有賭的成分，但是，這一次，PyTorch賭對了。

上手PyTorch的人，都會覺得好用。相信當GoogleTensorFlow內部的人看到，並且試用PyTorch的時候，也會讚嘆其易用性。但是，他們肯定還是相信TensorFlow是世界上最好的框架。

2017年前後，人們會發現很多古老的計算機視覺模型是用 Caffe 寫成，很多新研究論文是用 PyTorch 寫的，而更多的模型用TensorFlow寫成。

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第6張

不同的框架，不同的格式。

從框架A翻譯到框架B，從框架B翻譯到框架C……「翻譯」完，還要寫一堆測試。民怨沸騰了，有關部門得管管。

因此，ONNX（Open Neural Network Exchange）身負重擔而來。2017年最後一個月，ONNX的第一個版本發布，初版代碼是賈揚清手寫的，而最早投入ONNX的兩位開發負責人是白俊傑和張振瑞，前者還在賈揚清團隊，後者仍然是PyTorch團隊的核心成員。

賈揚清認為，ONNX的定位不是取代各種框架，而是讓大家做事順暢，ONNX輔助性地來解決這個問題。

facebook公司的PyTorch為什麼成功？

因為科研的百花齊放，渴求靈活。

Google公司TensorFlow為什麼成功？因為當時，AI正以熊熊大火燎原之勢，席卷工業界。那時那刻，需熔爐煉鋼之火。需要集團軍作戰，需要工業界不可或缺的穩定性。

成也蕭何，敗也蕭何。TensorFlow是工業級的軟體，學習門檻非常之高，開發者不禁會發出「危乎高哉，蜀道難」的感慨。這背後是計算機系統軟體的穩定性提升，必然伴隨龐雜性的攀升。

PyTorch，像小汽車，容易上手，但是，規模化難。

TensorFlow，像高鐵，體量巨大，但是，新手難操作。

易用性和穩定性，這是兩個存在且合理的需求。兩者各翻越過生態的天塹，雙方各爭下了一個山頭。設計深度學習框架永遠不是需求，而是手段。

TensorFlow解決了AI工業化，PyTorch解決了AI科研百花齊放。

很多人認為，最近幾年，深度學習框架這一塊，至少在TensorFlow和PyTorch的競爭中，幾乎塵埃落定。為什麼？因為這兩個需求已經基本解決了。

賈揚清認為，重復建設深度學習框架，好比整條街的咖啡都不太好喝，既不解決咖啡豆的問題，也不解決咖啡機的問題，直接重新開一個咖啡店。

在刀耕火種時代，在「第一代深度學習框架」之中，為什麼會出現Caffe，Torch，Theano等多款深度學習框架，因為探索之處確有需求，實實在在的需求。

在賈揚清看來，深度學習框架的效率分為兩個，第一個是開發者的效率，第二個是計算機軟體系統和執行的效率。

易用性解決的是開發者的效率。那計算機軟體系統和執行的效率呢？

此時，深度學習框架要想做得好，關鍵在於把「很底層很底層」的技術做高效，而不是重新做一個深度學習框架。而這部分的工作很硬核，加料一小段科普。計算圖，也可以理解為提前設計好的路線圖。

簡單說，深度學習框架訓練模型的時候，有這樣一件事情需要在深度學習框架裡完成，且考驗效率。出發時得一步一步來，喂數據，順著路，直到拿到一個輸出，完工。

這裡的「路」就是，訓練模型的路。

到底該怎麼走？先去五當山，還是光亮頂?

計算圖裡的「圖」，分為靜態圖和動態圖。靜態圖一早就定好這個過程，不讓改（深度學習框架也會把過程做個優化，計算起來效率高）。動態圖則不然，每次每批數據出發之前，允許路線圖變化。

深度學習框架裡的一招鮮，不能吃遍天下。

很多人都在問，有多款深度學習框架可選，這一款有什麼不同價值？如今，僅靠一種圖的形態已經沒法解決問題了，「低垂的果實」已經沒有了，需要靈活運用，巧妙出手，才能走出新路。

如今的天下，是人人都有深度學習框架用的天下。

下一步的競爭，是到底算得好不好，快不快，準不準。搞深度學習框架那幫人，就各有各的絕招了。

06 下一步，競爭什麼？

如今，深度學習框架的核心難點，並不是沒有框架可用。

賈揚清認為，如今的深度學習框架的核心難點有兩個：往下如何兼容硬件，往上如何實現更好的分布式開發。

兼容硬件這件事，和編譯器有關。有句俗話是，男兒有淚不輕彈，只是未見編譯器。一位老資格的AI算法工程師曾回憶，大學編譯器課上，他哭了，是被編譯器給氣哭的，因為太難了。所以，一生躲著編譯器走。惹不起，還躲不起？

果然，不出意外地出了意外。如果不是親眼所見，他是萬萬不敢相信。當AI模型「下地幹活」，編譯器的糟心事兒，又回來了。

哭有什麼用？BM-13「喀秋莎」多管火箭炮已經把炸藥傾瀉到編譯器的戰場了。戰爭不相信眼淚，深度學習框架在拼「誰可以更好地編譯和優化」。

一般來說，深度學習框架開發者只想著為少數服務器級硬件（GPU）提供支持，而硬件供應商則更願為部分框架開發自己的庫。兩邊自顧自高築牆，把周圍的戰壕土都用光了，於是，低頭一看，竟然挖出一個大坑來。

將AI模型部署到新硬件，需要大量的手動工作，如此一來，誰來填坑？說到底還是深度學習框架。這樣問題就總結出了，深度學習框架，往下如何兼容硬件？

只能讓深度學習框架和硬件平臺對接好，而不是對每種新硬件類型和設備都開發新的編譯器和庫。

說到編譯器，也有很多種，有圖學習的編譯器，有資料庫的編譯器。但深度學習編譯器一來，就可以將AI編譯器單獨分一類了。與傳統編譯器類似，深度學習編譯器也採用分層設計，包括前端，中間表達（IR），後端。

其中，編譯器和中間表達，就像異父異母的兩個親兄弟。一般來說，編譯器的優化是把中間表達部分裡一些可以跑得更快的地方，改動一下。

賈揚清心中的未來，可能是，AI編譯器可以為運行的任何硬件生成機器原生代碼，無需擔心中間表達。用深度學習框架寫的模型更自動化，模型跑得更快。這樣，AI產業有機會整體提效。賈揚清說，互聯網大廠的AI工程體系還在整合。AI的落地情況，好比1980年代的「現代化」，樓上樓下，電燈電話。

搞深度學習框架那幫人一個崗位飾演多個角色，從算法研究員，軟體工程師，數據工程師，應用工程師，到系統統工程師。千難，萬難，自己選的路，跪著也要走完。

講一個真實的案例，一位多金且懂行的客戶說，這裡有一個圖片識別模型，想跑得快一點。

搞AI框架那幫人（二）：賈揚清與阿裡靈傑科技第7張

本質上，事到如今，AI還不是超級APP。

這裡有兩層含義：

一、不是一個單點產品就能大包大攬AI所有能力，而是一系列能力的組合；

二、AI非常強烈地需要標準軟體+定制化服務。

遠見者穩進，穩健者遠行，賈揚清為什麼發布阿裡靈傑，發布阿裡整體大數據＋AI能力？

回望八年前，一個工程師具備訓練圖像識別模型的能力，就已經是AI開發者裡的高手。

如今，已經是將AI的算法和數據、場景結合起來，去構建一個完整的解決方案，解決各行各業當中的實際問題。

賈揚清認為，從開發的角度，從寫下第一行代碼，到完成第一個AI模型，需要多久？

從應用的角度，從抓住一個需求，到AI產品原型上線，需要多久？

對於阿裡靈傑來說，從底座，到上層應用，整體都能讓開發者按需取用，開箱即用。

這樣，才有可能在雲上畫出人工智慧第二增長曲線。

如今，產業正在經歷大數據和AI一體化，需要經久耐用的底座。

在阿裡雲的底座裡，阿裡雲機器學習平臺PAI出手就是一（流）條（水）龍（線）服務，管資源、管任務。大規模分布式訓練框架Whale，可以理解為是PAI裡的一個軟體包。數據倉庫MaxCompute支持大型分布式數據計算。DataWorks提供一站式數據開發、管理、治理平臺。

學生時代，賈揚清的電腦顯卡性能不強，玩3D遊戲《荒野大鏢客》會把遊戲畫面設置到最低，以免畫質感人。時間一長，「隨手最低」習慣成自然。

工作後，賈揚清如願以償，換上最強顯卡。初初上手，仿若從前，突然，他想起顯卡不再是從前的顯卡。快，快，快把遊戲畫面設置調成最高，享受一下。那一刻，賈揚清看到了一個完全不一樣的遊戲。

從1956年的達特矛斯會議算起，2021年的AI已走過65個春秋，時間好不經用，抬頭已過甲子。搞深度學習框架的那群人，說到底是做基礎設施的人，他們相信，會有一天，AI生產工業化一片坦蕩，大數據和大模型在流水線上高速沖浪……

那時候，人們將看到一個完全不一樣的AI。

致謝：感謝賈揚清，他耐心地回答了我的數百個問題，使這篇文章成為可能。

更多精彩內容，關註鈦媒體微信號（ID：taimeiti），或者下載鈦媒體App

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接❤️

更多文章