AI產業化的正確路徑是什麼?百度文心ERNIE知道

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

從百度發力AI算起,AI在中國商業化進程已超過10年,AI算法、算力、數據等基礎設施均已完善。2020年的疫情,直接加速世界數字化與智能化進程,全社會對智能化達成高度共識。今年兩會上,百度李彥宏、聯想楊元慶、小米雷軍等代表們的提案均關係到AI,強調要推進AI在交通、養老、制造等領域的應用落地,避虛向實。十四五規劃綱要中,「科技」出現36次,「數字」出現17次,「智能」出現7次,規劃綱要明確要「推進互聯網、大數據、人工智慧等同各產業深度融合。」

2021年將是AI產業化的關鍵年,那麼AI產業化的關鍵是什麼?從百度知識增強語義理解平臺「文心ERNIE」的應用歷程,可以井蛙之見。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第1張

AI產業化的關鍵到底是什麼?

百度文心ERNIE的發展歷程可追溯到2013年,當時百度基於神經網路語義匹配技術改進搜索效果,讓網頁搜索相幹性顯著提升。2018年10月Google發布預訓練模型BERT,掀起了自然語言處理技術范式的革命。百度不甘示弱,基於多年來的AI技術積累,在2019年3月發布並開源知識增強的預訓練模型文心ERNIE1.0,在語言推斷、語義相似度、命名實體識別、情感分析、問答匹配等自然語言處理各類中文任務上的效果超越BERT;同年7月,發布持續學習的語義理解框架文心ERNIE2.0,在16個中英文任務上超越BERT和XLNet。

百度文心ERNIE本質是語言與知識技術平臺,被歸類為認知智能,其讓機器具有認知能力,是人工智慧最關鍵的一環。截至目前,文心ERNIE已被廣泛應用於百度搜尋引擎、資訊流、智能音箱等幾十個內部產品;同時通過百度大腦對外開放,累計支持超過2萬名開發者,廣泛應用於金融、通訊、教育、互聯網等行業。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第2張

距離正式推出只有兩年時間,百度文心ERNIE是如何實現產業化的快速落地的?

首先,打鐵還需自身硬,AI要技術先行。

AI產業化本質是讓AI技術在行業應用落地,助力對應產業降本增效與創新升級,足夠強大的AI技術是最大前提。文心ERNIE就是百度AI技術先行的代表。一方面,百度AI重視底層核心技術的自主研發,而不是拿來主義,深度學習平臺飛槳PaddlePaddle與百度文心ERNIE均秉持這一理念。另一方面,百度從未停止技術迭代,因為AI算法要基於數據與場景的錘煉不斷進化,提高智能能力,百度文心ERNIE就是百度沉淀多年的NLP與知識圖譜技術的集大成者。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第3張

不斷拿下世界級大獎,足以證明百度文心ERNIE的技術實力。基於文心ERNIE,百度在2019年12月以超越人類3個百分點水平摘得自然語言處理權威數據集GLUE全球第一,在9個任務平均得分首次突破90大關,刷新該榜單歷史,相應成果受到國際頂級科技商業雜誌《MIT Technology Review》官方報導。2021年3月,在GLUE新排名中,百度文心ERNIE以90.9的分數再登榜首,領先微軟 DeBERTa/TuringNLRv4、Google T5以及阿裡巴巴、華為等研發的同類別技術。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第4張

其次,提供開發套件,跨越AI產業化技術鴻溝。

AI技術應用到產業,存在較大技術鴻溝。對於大多數開發者特別是傳統軟體開發者來說,AI技術門檻太高,給這些開發者提供簡單易用的AI技術解決方案至關重要。

2016年百度開始通過百度大腦開放語音技術、視覺技術、自然語言處理在內的數百項AI能力。百度熟知開發者在應用AI技術時面臨的門檻高、龐雜度高等痛點。基於此,百度文心ERNIE不是像公有雲開發平臺一樣提供API,而是在2019年11月發布了「文心ERNIE語義理解開發套件」,讓不同行業的開發者可以快速、簡單、輕松地開發AI應用。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第5張

可見,AI技術平臺不應該只是底層API,而應該解構AI技術,結合產業特性,提供開發工具組合,讓傳統IT開發者可以快速輕松擁抱AI。

最後,百度先吃螃蟹,「從內到外」全面落地。

百度文心ERNIE源於2013年百度推出的神經網路語義匹配技術,其最初被用於改進搜索結果相幹性。百度文心ERNIE也是在百度搜索等自有業務場景錘煉成熟後,才對外開放。應用於百度自有業務時,在海量知識與數據的錘煉下,百度文心ERNIE技術持續進步,ERNIE2.0模型已學習1500萬篇百科語料和詞語、實體知識,700萬個人類對話,3億文章的因果結構關係,10億次搜索查詢與結果的對應關係,以及2000萬的語言邏輯關係知識。在這些數據的「填喂」下,百度文心ERNIE技術持續進化,在內部錘煉成熟後,2019年百度文心ERNIE才對外開放給各行各業。

為什麼百度文心ERNIE的開放對AI產業化很重要?一方面,語義理解是AI基礎能力,AI應用均很難繞過,百度文心ERNIE有較大的通用性,其可快速適應各行各業的產業場景,通過開發套件這種模式,直接降低了行業應用難度。另一方面,百度文心ERNIE是百度AI開放「武器庫」的一件武器,百度大腦AI開放平臺匯聚深度學習平臺飛槳、AI Studio、EasyDL零門檻AI開發平臺等平臺,語音、圖像、文字識別、人臉、NLP、知識圖譜等AI能力,在各行各業深耕多年聚集了開發者、行業影響力與技術資源,百度文心ERNIE「站在巨人肩膀」上快速普及。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第6張

不只是百度文心ERNIE,百度開放的各種AI應用,均是先在自有業務應用、錘煉與進化,到一定階段再開放給行業,在AI產業化的海量場景中進一步錘煉學習進化,反過來讓AI技術則得到進一步提升,這種「由內到外」的開放模式,形成了正循環效應。

AI產業化是一個系統工程

AI產業化是十四五期間我國經濟發力的一個重要方向。在經歷貿易摩擦後,我國更加意識到自主技術的重要性,AI是未來科技的制高點之一,掌控自主核心科技更有必要,因此在AI產業化進程中,我國強化自主核心AI科技是可預見的趨勢。

今年3月,由史丹佛大學發起的人工智慧指數(AI Index)報告顯示,中國在AI學術工作方面的成就超過美國。多年前,中國的 AI 期刊發表文章數量即超過美國,現在中國首次在期刊引用量上占據了優勢。AI Index 聯合主席 Jack Clark 表示: 「各種維度的文獻分析表明,在人工智慧發展方面,美國和中國已經成為彼此對等的國家。」

AI產業化是我國的重大機遇,依托產業資源和市場規模,中國AI產業化更加務實,整體進程有望領先世界。當然,要確保這一點,國家頂層設計、人才生態建設與AI產業生態都不可或缺。

從十四五規劃綱要來看,我國在支持AI產業化上已經有較為完整的頂層設計,涵蓋底層技術、產業應用、社會民生等領域。十四五規劃綱要指出,要加快建設新型基礎設施,「圍繞強化數字轉型、智能升級、融合創新支撐,布局建設資訊基礎設施、融合基礎設施、創新基礎設施等新型基礎設施。」在「加快數字化發展 建設數字中國」獨立篇章則指出,要加強關鍵數字技術創新應用,「聚焦高端晶片、操作系統、人工智慧關鍵算法、傳感器等關鍵領域,加快推進基礎理論、基礎算法、裝備材料等研發突破與迭代應用。」

在人才生態上,百度等企業與學校通過產學研融合模式培育AI人才,百度事實上已成為高端AI人才的「黃埔軍校」,同時百度已宣稱將給行業培養100萬AI人才,2020年百度推出兩個「500萬」計劃:預計到2030年,百度智能雲服務器臺數超過500萬臺;未來5年,預計培養AI人才500萬。去年兩會,李彥宏在提案中就曾指出要加強人工智慧基礎和應用人才培養,今年明確提出進一步加強人工智慧教育體系建設,讓更多人實現高質量就業。

在AI生態上,以百度為首的AI巨頭正持續構建繁榮的AI開放生態。百度智能雲面向垂直行業提供端到端解決方案,幫助對應產業快速實現智能化轉型,例如在智慧城市賽道,百度智能雲用「雲智一體」助力北京海淀打造智慧城市「樣板間」的案例刊登上《人民日報》;飛槳則已凝聚超265萬開發者,服務10萬家企業,基於飛槳平臺創建了超過34萬個模型,在城市、工業、電力等很多關乎國計民生的領域都有飛槳在發揮作用,比如其攜手國家電網和山東信通打造電網智能巡檢方案,分析準確率達到90%,報警響應速度更是從小時級提升為秒級。獨樂樂不如眾樂樂,AI開放讓百度在AI產業化浪潮中扮演「基礎設施承建商」的賦能角色,百度將在創造價值中獲取價值。

日前百度已成功在港交所二次上市。在上市儀式現場李彥宏致辭稱,百度是一家始終相信和熱愛技術的公司,他將百度前二十年的技術布局分為兩個階段:最初10年專註搜索技術開發,演化出語音、圖像、知識圖譜、自然語言處理等人工智慧技術,最近 10 年,「我們在深度學習、對話式人工智慧操作系統、自動駕駛、AI 晶片等前沿領域投資,讓我們成為一個擁有強大互聯網基礎的領先 AI 公司。」文心ERNIE正是從搜索技術「演化」出的AI技術。

AI產業化的正確路徑是什麼?百度文心ERNIE知道 科技 第7張

2005年百度登陸納斯達克的標簽是「最大中文搜尋引擎」,今天百度回歸港交所,最新標簽已變為「擁有強大互聯網基礎的領先 AI 公司」,李彥宏說,回到香港二次上市,是百度的再次出發,是百度的二次創業。在AI產業化的關鍵年,百度10年來沉淀的AI技術價值,正在被開發者社區、傳統產業與資本市場認可,在AI產業化浪潮中,百度大概率會成為最亮眼的那朵浪花。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!