鄧志東:細分迭代是「智能+」落地的關鍵

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

鄧志東:細分迭代是「智能+」落地的關鍵 科技 第1張

清華大學智能技術與系統國家重點實驗室教授 鄧志東

3月21日,己亥年人工智能春季創新大會在北京國賓酒店隆重召開,大會由人工智能產業創新聯盟和賽迪傳媒共同主辦。會上,政府主管、企業領袖以及人工智能領域的資深專家悉數到場,圍繞人工智能與實體經濟深度融合展開了全面、細致的交流與研討,各種創新觀點融合交匯,為人工智能的創新應用提供了新思路、新路徑。

聯盟專家委主任委員、清華大學智能技術與系統國家重點實驗室教授鄧志東分享了關於人工智能落地應用的深層次思考。他指出,人工智能在工業、零售、醫療、客服等領域都做到了創新應用,與此同時,人工智能在實踐過程中仍面臨一些挑戰。

大數據人工智能創新實踐面臨的挑戰

自2013以來,大數據和大計算驅動的深度學習已成為計算機視覺、語音識別與真實感合成、自然語言處理、大數據分析等的主流方法。數據驅動方法已被視為繼實驗科學、理論模型、模擬仿真之後的第四科學研究范式。正如同網路技術一樣,已逐漸變革為一種通用賦能工具,目前已遠遠超越計算機科學與技術本身的范疇。

以深度卷積神經網路為基礎的新一代人工智能,能夠獲得更加接近於人類水平的視聽覺感知能力和對文本自然語言的模式分類能力,帶來了超越人類的棋類動態博弈能力。近年來,超人類水平的AlphaGo,引起了社會的強烈關注。特別是AlphaZero,帶來了無需大數據且可從零開始進行自主學習的棋類通用人工智能。

對抗性神經網路的最新進展,帶來了超真實感的想像能力,兩個深度卷積神經網路通過相互對抗來生成超分辨率具真實感的原創圖像、聲音、3D物體或自然時序數據,這對半監督、無監督學習方法的研究,是一個非常重要的進展。2018年《麻省理工科技評論》把對抗性神經網路列為全球十大突破性技術之一。特別地,基於深度神經網路的目標檢測、定位、分割(如語義分割、實例分割與全景分割),自2014年R-CNN問世以來,已取得了非常大的進展。目前的研究重點已超越了簡單的分類識別任務,開始進一步研究動作與行為意圖的檢測與識別。例如,研究基於視覺深度神經網路的表情、手勢、動作識別與行為意圖預測等,這些都為人工智能的產業滲透帶來了更多新的方向。目前,一些典型的人工智能產業應用與創新實踐包括:AI刷臉支付、AI無人零售、AI錄影頭、AI音箱、AI視頻換臉 (虛擬主持人)、 AI速記員、 AI實時翻譯耳機、AI手持翻譯機、AI語音助手、AI電話客服、AI醫學影像診斷、AI-IoT等。

人工智能還賦能自動駕駛的主要細分領域,包括自動駕駛的環境感知與建模、自主導航、決策規劃、控制與人機交互(如智能駕駛艙)等。在這個熱點產業方向,Google已於2018年12月5日正式推出了新的商業自動叫車經營品牌Waymo One,率先在美國鳳凰城地區開啟了全球首個付費自動駕駛計程車小規模商業化服務。人工智能也賦能於智能機器人產業,無論是工業機器人,還是服務機器人與特種機器人,人工智能相當於模擬機器人的大腦。機器人產業本身要模擬人的手和腿,手要靈巧地操作,腿要靈活地移動。當然,最重要的就是模擬人的大腦,靠人工智能來賦予機器人感知與認知能力。

基於深度學習的計算機視聽覺感知方法,需要海量大數據的驅動,目前也缺乏認知水平的理解能力。需要解決的是,如何提供基於小樣本的「數據感知+認知理解」能力?此外,在落地應用中,考慮到在開放環境下實際上是不存在完備大數據的,因此對於各種實際應用場景,大數據人工智能均只能獲得較接近於人類水平的視聽覺等感知能力,這與各種基於公開評測數據集得到的性能極限指標,是完全不同的。總之,就目前的深度學習算法來說,不僅缺乏人類舉一反三的小樣本學習能力和對目標的認知理解能力,而且不能有效利用常識與記憶,也不能進行基於知識的因果推理。

鄧志東認為,中國人工智能創新實踐面臨挑戰,一是大陸人工智能技術的原始創新能力不足,基礎算法、高端人工智能晶片主要還是以跟蹤西方國家為主;二是投資界過於追求短線逐利;三是體制機制障礙,國有巨頭型企業前瞻性戰略布局不多,投入力度小,民營科技巨頭在扛大旗;四是人工智能落地應用面臨著諸多困難;五是缺乏高端的基礎性研究人才,特別是創新能力強的人才,另外我們還需要大量的人工智能工程開發人員。

同時,他還指出,大數據人工智能的發展,也會帶來法律、倫理、隱私安全和失業等方面的挑戰。但對人類而言,目前的大數據人工智能總體是賦能而有益的。認知智能與通用人工智能的發展,則將對技術與產業的發展帶來真正的變革,但也有可能威脅到人類自身的安全;有必要進行未雨綢繆的研究,預做準備以進行規範制約。

大陸於2017年發布了《新一代人工智能發展規劃》,把人工智能的發展升級為國家戰略,並提出了三步走的戰略目標。第三步是到2030年,中國人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創新中心。鄧志東認為,成為世界主要的人工智能創新中心這個目標非常具有挑戰性,目前僅有10年多一點的時間了。

黨的十九大報告提出,推動互聯網、大數據、人工智能和實體經濟深度融合,培育新的經濟增長點,形成新的轉換動能。人工智能從2017年開始,已經連續三年寫入了政府工作報告。在2019年總理政府工作報告中,人工智能升級為拓展「智能+」,指出要「深化大數據、人工智能等研發應用」,賦能傳統製造業轉型升級。力爭通過新一輪科技革命,加速培育大陸新興產業集群,壯大數字與智能經濟,推動產業結構變革。3月19日召開的中央全面深化改革委員會第七次會議,審議通過了《關於促進人工智能和實體經濟深度融合的指導意見》,強調必須以市場需求為導向,以產業應用為目標,構建數據驅動、人機協同、跨界融合、共創分享的智能經濟新形態。

在國家發展戰略與產業政策的推動下,我們看到新一代人工智能的應用場景其實是非常豐富的,比如AI-IoT、5G、VR/AR、智能零售、智能安防、智慧型手機、智能家電、智能家居、智慧城市、智能製造(例如,零部件的外觀質量檢查)、自動駕駛、智能機器人、無人機等,而且還正在滲透更多的垂直應用領域。大數據人工智能將無處不在,可望替換更多依賴人類視聽覺功能的服務性工種和更多需要環境適應性及自主性的複雜體力勞力。

人工智能與實體經濟怎樣做到融合?鄧志東認為,細分迭代是「智能+」落地的關鍵,大陸要率先努力形成世界領先的人工智能產業生態。隨著人工智能的產業滲透不斷加快,「智能+」產品的開發與產業發展正處於艱難的深耕期,與實體經濟的深度融合方興未艾。但人工智能的應用場景要細分,要專注於細分場景的大數據實踐,有定力、有耐性地積累海量的標籤大數據。另外我們還需要在應用實踐中不斷地進行數據、性能和體驗的迭代學習。同時也需要大計算能力等人工智能公共基礎設施的有力支撐。但總之,人工智能的發展最終要能給企業和社會創造價值。

「智能+」是一條條「細線」上的人工智能創新應用實踐。目前的大數據人工智能創新應用產品,需要細分到特定的應用場景,進行有耐性的打磨。要敢於大膽地推廣應用人工智能產品,新一代人工智能技術具有數據學習能力,用戶體驗可以在應用實踐中不斷地進行迭代升級,這一點尤其重要。歸結起來,只要把每條「細線」上的人工智能落地應用都做到接近於人類水平,涓涓細流匯聚起來,就能大幅度地提高傳統製造業的智能化水平。

人工智能創新應用的路徑與模式

從「互聯網+」到「智能+」,以市場需求為導向,以產業應用為目標,通過數據驅動和跨界融合,推動「智能+實體經濟」的深度融合,助力傳統製造業的轉型升級以及數字經濟、智能經濟的發展。應以應用場景、大數據、人工智能算法和計算能力四大維度,打通產業鏈條,推動人工智能的創新實踐和應用落地。一句話就是「大數據是基礎,算法是核心,晶片是高地,人才是關鍵,但選定垂直細分領域最重要」。

怎麼選定特定的應用場景?人工智能的落地應用,不可能是通用寬泛的,而是要選定一個特定的細分問題入手,一點一滴地開始。實際上,並非所有場景的問題都能由人工智能解決。選擇的原則之一就是,能處理的特定應用場景具有較好的數字化、網路化基礎,能夠源源不斷地產生大數據。我們要特別優選信息化基礎比較好的行業或細分應用領域。

在各個垂直領域或行業,關鍵是對垂直領域進行細分再細分。例如,可以優選那些生產環境惡劣、產業價值高或人員稀缺的細分場景。由於目前人工智能的技術突破主要在感知智能領域,所以在各種需要高級熟練工人使用「眼睛」、「耳朵」等感知直覺完成的工作上,若人工智能通過自動學習能夠達到熟練師傅「聽故障」和「看瑕疵」的水平,這樣就可以做到對人工的替代。

為什麼說大數據是基礎?「智能+」某種意義上就是「大數據+」,因為目前的人工智能就是所謂的「人工+智能」,本質上是把人的經驗或直覺判斷通過標籤的形式轉移給機器,然後賦予機器所謂的視聽覺「感知智能」。前面已說過,應用落地時的開放環境下並不存在完備大數據,而且還有數據與性能的所謂「長尾效應」,也就是「行百里者半於九十」的意思,因此我們不僅必須盡可能多地積累和運用標籤大數據,而且越到後面越困難,就越需要堅持。這也說明,在產業應用中亟需發展基於小樣本的深度學習方法。此外,利用「人工」對數據進行清洗和做標籤,包括對標籤的質量審核等,催生了「標籤工」這一新的工種。在應用實踐中,需要建立一支工程團隊,投入大量人力物力去做數據積累和數據標籤,特別是建立高質量的標籤大數據。基本上80%以上的人力、物力,都要投入到特定的細分問題上,去深耕應用場景和數據。按照現階段的算法水平,還不存在一個高大上的萬能方法,可以「輕鬆」地解決所有場景的人工智能應用。我們應以工匠精神深耕製造企業中的細分場景與大數據應用。通過「智能+」打磨人工智能產品,助推與傳統製造業的深度融合及品質革命實踐。以數據驅動、人機協同,通過「智能+xxx」的跨界融合,加速從基礎層、核心技術層、開放平台層到應用層的人工智能產業生態建設,以大陸人工智能產業和智能經濟社會的快速發展,牽引驅動人工智能基礎研究與前沿技術的全面進步。

為什麼說算法是核心?基於深度學習的計算機視覺、機器語音、真實感數據生成、詞嵌入向量等,作為人工智能算法的主要支撐,已成為「人工智能+」或「+人工智能」的產業核心共性技術,賦能產品、流程與服務體驗。在探索下一代人工智能核心算法方面,亟需發展具有類似於人類舉一反三小樣本學習能力的人工智能算法,具體途徑包括與知識圖譜結合起來,尤其是與具有學習能力的知識圖譜相結合。另外還須發展具有認知理解能力,具有記憶、常識和推理能力的人工智能新算法。比如發展圖卷積神經網路,以「深度學習+無監督」的方式進行實體識別,結合概率圖模型(知識圖譜)抽象、延伸概念,賦以其內涵與外延,以做到對場景或目標的認知水平的理解。

晶片是高地。目前的人工智能晶片主要包括通用人工智能晶片,專用人工智能晶片和類腦晶片。普遍認為,工業互聯網、工業物聯網、5G通信、雲平台和數據中心等,共同構成了大數據人工智能產業應用的硬件基礎設施。

人才是關鍵。人工智能基礎算法的創新,核心關鍵技術的突破,通用人工智能晶片和類腦晶片等高端人工智能晶片產品的研發,對具有原始創新能力的高端人才提出了迫切的需求。隨著人工智能產業的迅猛發展,特別是人工智能對各個產業的滲透不斷加快,人工智能工程技術開發人才的存量和增量存在嚴重不足,需求與供給的矛盾日益突出,因此必須加快大陸人工智能人才高地的建設。

總之,深度學習主導的新一代人工智能已成為技術與產業的通用賦能工具和科學研究的第四范式,正在變革技術,賦能產品,滲透產業,重塑社會,加速智能經濟的發展與智能社會的結構性變革。深度學習方法應用創新實踐面臨的重大挑戰,不僅包括缺乏人類舉一反三的小樣本學習能力和認知水平的理解能力,而且不能有效利用常識與記憶,也不能進行基於知識的因果推理。人工智能的產品開發與產業發展正處於爆發期,與實體經濟的深度融合方興未艾。「智能+」落地,關鍵是應用場景的細分與實踐過程的迭代。需要特別專注於細分場景的大數據實踐,特別是數據、產品與性能在創新應用中的迭代。只有應用落地與用戶體驗做好了,給企業和社會帶來了價值,才能構成正反饋迭代,人工智能技術與產業才能得到進一步的蓬勃發展。從「互聯網+」到「人工智能+」,真正以市場需求為導向,以產業應用為目標,通過數據驅動和跨界融合,推動「智能+實體經濟」的深度融合,促進傳統產業的轉型升級與數字經濟、智能經濟的協同發展。

以上內容,來自人工智能產業創新聯盟專家委主任委員、清華大學智能技術與系統國家重點實驗室教授鄧志東在己亥年人工智能春季創新大會上的演講,經整理編輯。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!