尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
記者 | Jane責編 | 琥珀出品 | AI科技大本營(id:rgznai100)
近年來,隨著人們對 AI 認知能力的積極探索,知識圖譜因其表達能力強、拓展性好,基於知識進行推理等優勢得到了學界與業界的高度關注。知識圖譜,旨在描述客觀世界概念、實體、事件及其之間關係,具備可解釋性,而且可以用於解決複雜決策問題。這也意味著通過深度學習與知識圖譜的結合,模型底層特徵空間與人類自然語言之間巨大的語義鴻溝問題有望得以解決。在大數據和機器學習兩大引擎下,大規模知識圖譜的自動化構建成為現實,這就加快了知識圖譜的落地與應用。
傳統意義上,知識圖譜可以劃分為通用知識圖譜和領域知識圖譜。例如,國外的Google搜尋引擎和國內的百度搜尋引擎,這類通用領域知識圖譜是最先被大家熟知的應用;而場景的不斷豐富、需求不斷增多、用戶對體驗與品質的要求不斷提高,各行各業都亟需構建領域知識圖譜。
那麼,從趨勢到實際需要,知識圖譜已經取得了哪些學術與技術成果,產業與應用發生了哪些變化?當下知識圖譜領域最關注的問題又是什麼?未來,知識圖譜又有哪些發展前景?最近,AI科技大本營採訪到了東南大學教授、博士生導師,東南大學認知智能研究所所長漆桂林。
漆桂林認為,目前知識圖譜整個領域最關注的問題還是如何能夠高效、低成本構建知識圖譜,而這個問題對於研究人員來說,仍是一個非常大的挑戰,比如現在大家都在關注如何在少量甚至無標註場景下進行知識圖譜構建。
從知識抽取到知識推理,大家在關注什麼?
漆桂林表示,近兩年知識圖譜研究有一些值得關注的成果,比如:
- 知識抽取,如何在少量甚至無標註場景下進行知識圖譜構建是一個具有挑戰性的問題。目前大家都在關注基於圖神經網路、增強學習、交互式知識抽取等方法。
- 知識融合,代表性工作有交互式知識融合以及基於表示學習的知識融合的工作。
- 知識更新,針對百科類知識圖譜的自動化更新技術取得了一些突破,從而可以對百科知識進行自動化更新。
- 知識推理,最近兩年有不少混合式推理的方法出現,也就是混合機器學習和符號推理的方法,這些方法的提出對於解決某些機器學習技術的不可解釋性,以及提升知識圖譜的推理能力都有作用。
與此同時,這些關鍵技術的應用也有一些突破性的進展,尤其是在知識抽取和知識融合方面:一是人機交互的商業化系統的出現,二是關於人機交互的信息抽取和知識融合的學術論文也開始。
在他看來,知識圖譜表示學習與推理也取得了很多進展,大家開始研究知識表示學習在多模態數據上的應用,即結合文本、知識圖譜、圖像或者視頻的知識表示學習,以及基於知識表示學習的推理。
從通用走向領域:廣泛複雜的場景
知識圖譜從以前研究與產業界脫鉤,到現在領域知識圖譜成為研究的重點,開始面向解決實際的問題。比如最近司法知識圖譜的構建出現了不少研究成果。另外,知識圖譜用於解決問答、推薦系統、圖像理解方面的論文也不斷在增加。
同時,知識圖譜在不同行業也得到了廣泛應用,領域知識圖譜成為企業的迫切需求。例如,金融領域中的信用評估、風險控制、反欺詐問題;醫療領域中的智能問診問題。從通用知識圖譜到領域知識圖譜,知識圖譜開始在越來越廣泛、複雜的場景中落地並解決實際問題。
「在醫療、電商、金融、軍工、電力、司法、教育、公安、石油這幾個領域知識圖譜已經落地並且取得了突出成果。」漆桂林談到。知識圖譜可以幫助這些領域的公司或研究機構更好地處理多源異構數據,也就是說可以提供一個統一數據模型並且可以靈活地集成和關聯這些數據,對這些數據進行關聯分析。
知識圖譜產學研相輔相成
「知識圖譜的產學研需要有一個整體規劃,這也是我一直在實踐的。」漆桂林表示。
在他看來,首先需要了解產業界對知識圖譜的需求,知道知識圖譜可以解決什麼應用問題,帶來什麼價值。
其次,通過了解知識圖譜落地的挑戰,確定知識圖譜的研究課題。
從短期和長期來看,短期課題是要解決產業界急迫的問題,比如少量標註情況下的信息抽取方法的研究;而長期課題是面向三年之後可能對知識圖譜落地有用的技術,比如無標註場景下的信息抽取技術。
最後,讓知識圖譜技術可以快速普及。為了進一步貫徹知識圖譜的產學研,漆桂林還聯合學界、工業界的專家共同成立了 OpenKG 聯盟。
漆桂林簡介
漆桂林,東南大學教授,博士生導師,東南大學認知智能研究所所長。現任中國中文信息學會語言與知識計算專業委員會副主任和中國科學技術情報學會知識組織專業委員會副主任。2006年,漆教授獲得英國貝爾法斯特女皇大學計算機博士學位,導師為人工智能界著名專家 Weiru Liu 教授。2006年8月至2009年8月在德國Karlsruhe大學AIFB研究所做博士後研究,導師為語義 Web 界國際知名專家Rudi Studer教授。
漆桂林,東南大學教授,博士生導師,東南大學認知智能研究所所長。現任中國中文信息學會語言與知識計算專業委員會副主任和中國科學技術情報學會知識組織專業委員會副主任。2006年,漆教授獲得英國貝爾法斯特女皇大學計算機博士學位,導師為人工智能界著名專家 Weiru Liu 教授。2006年8月至2009年8月在德國Karlsruhe大學AIFB研究所做博士後研究,導師為語義 Web 界國際知名專家Rudi Studer教授。
目前,漆桂林的研究方向為:知識圖譜的表示和推理、通用知識圖譜構建、情感分析、智能問答、關係抽取、多模態圖像處理。
在知識圖譜的表示和推理,知識圖譜融合和更新,通用知識圖譜引擎構建,以及高效、低成本構建知識圖譜方面取得了一些成果,包括:
- 一套並行本體推理引擎和一套規則引擎,可高效處理千萬級別本體推理,並且支持本體和規則的混合式推理;
- 一個通用知識圖譜系統,可針對百科數據進行抽取、融合、更新、推理,還可針對各種社交網站數據自動化構建知識分類體系;
- 一個針對通用知識圖譜的問答引擎,可處理複雜問句的問答;
- 一套在少量標註情況下的知識抽取工具。
關於杭州 CTA 核心技術大會·知識圖譜論壇的準備工作
作為本次杭州 CTA 大會知識圖譜論壇的出品人,漆桂林表示:「我希望跟各位嘉賓交流他們在知識圖譜產業化落地過程中遇到的主要技術挑戰有哪些,這些技術挑戰可以為高校的研究帶來什麼好的課題。」
他還表示,無論是對知識圖譜前沿技術研究還是對知識圖譜產業化落地感興趣的人,都值得來參加。與會者在本次論壇將了解知識圖譜最新技術進展與知識圖譜應用價值,知識圖譜落地的技術挑戰,如何解決這些挑戰,本次論壇的一個目的就是探討知識圖譜下一步發展的道路。
5月25-27日,由中國IT社區CSDN與數字經濟人才發展中心聯合主辦的第一屆CTA核心技術及應用峰會將在杭州國際博覽中心隆重召開,峰會將圍繞人工智能領域,邀請技術領航者,與開發者共同探討機器學習和知識圖譜的前沿研究及應用。
目前8折會議預售票搶購中,搶購地址:https://www.bagevent.com/event/2586643
添加小助手微信15101014297,備註「CTA」,了解票務以及會務詳情。
(本文為 AI科技大本營原創文章,轉載請聯繫 10972722531)