尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
摘要:吳華博士作為NLP領域世界頂尖的科學家,作了題為「知識與語言智能」報告,為現場數千名參會人士梳理了自然語言處理技術的演變與發展,同時介紹了百度在這一領域的長期積累與新突破。百度自然語言處理技術的發展,同樣得益於深度學習、大數據、知識圖譜的強大助力。
「理解語言,擁有智能,改變世界,是每一個NLP人的使命。」5月18日,百度技術委員會主席、自然語言處理部首席科學家吳華博士在成都舉辦的ACM中國圖靈大會(ACM TURC 2019)上如是說。
作為中國計算機領域最有影響力的學術盛會之一,本屆圖靈大會以「註智世界,賦能未來」為主題,匯聚了包括曼紐爾·布盧姆、希爾維奧·米卡利、萊斯利·瓦利安特3位ACM圖靈獎獲得者在內的多名產學界世界頂級專家,共同探討人工智能的前沿應用與發展趨勢。吳華博士作為NLP領域世界頂尖的科學家,作了題為「知識與語言智能」報告,為現場數千名參會人士梳理了自然語言處理技術的演變與發展,同時介紹了百度在這一領域的長期積累與新突破。
「上帝為了阻止巴別塔的建立,讓人們擁有了不同的語言,而跨語言溝通成了人們的共同夢想。如今,自然語言處理技術使得這一夢想觸手可及。」吳華博士談到,人工智能的本質就是讓機器像人一樣感知和認識世界。語言能力是人類區別於動物的最顯著的特徵,而自然語言處理技術讓機器系統擁有人類的語言智能。自然語言處理從第一台計算機誕生之初,就開始萌芽,經過數十年的發展,憑借深度學習、大數據技術持續發展和知識的不斷累積,自然語言處理迎來黃金髮展期。而百度,則成為該領域技術發展的親歷者和引領者。
作為百度自然語言處理部首席科學家,吳華博士詳細地介紹了百度在這一領域的深耕與布局。百度在語言和知識方面有深厚的積累,擁有最大的中文知識圖譜,以及領先的語言理解和語言生成技術。百度自然語言處理技術的發展,同樣得益於深度學習、大數據、知識圖譜的強大助力。在深度學習方面,百度自主研發並開源的國內首個深度學習框架PaddlePaddle,擁有全面業務模型、超大規模深度學習並行技術和全面領先的高速推理引擎,支持千億級別稀疏特徵任務的並行訓練。在深度學習模型擬合語言的同時,對語言「真正」的理解也離不開豐富的背景知識,為此,百度構建了包含實體、事件、關注點、地點、行業知識等在內的大規模多元異構知識圖譜。這些描述真實世界的知識,被融入到基於實體關係的語義表征、知識增強的閱讀理解、以及知識驅動的對話系統中,在深度學習模型與邏輯符號系統融合的探索中,做到對自然語言的更深入理解。基於上述技術,百度開發了PaddleNLP,提供了基於工業級數據訓練的語義表示、閱讀理解、人機對話等全棧智能文本處理能力。
事實上,本次圖靈大會不僅是人工智能的知識盛宴,同樣也是產學對話的一次難得契機。
作為中國人工智能企業的代表,百度在產學融合道路上做出的努力值得肯定。通過平台開源、師資培訓、課程共建、技術競賽、教材出版等多種形式,百度已經形成了一套多層次、全領域的校企合作模式。正如大會主題「賦能未來」表達的那樣,百度正通過自身的技術革新和對年輕人才的助力,切實推動人工智能技術的發展,真正做到「賦能未來」。