尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
摘要:劉志龍解釋稱,「在工業領域中的知識圖譜,關鍵點不是剛開始數據量有多大,而是找到場景的本體,構建數據抽取方式,從而構建知識圖譜體系,更關鍵的是如何讓一線工作人員將這套產品應用起來。由於工業中包括檢修、預測等要求高精準的應用,專業領域特定場景應用數據量小,決定了工業知識圖譜的構建將是自上而下的一個過程——定義應用場景、定義問題、找到相應數據。
工業互聯網中,數字孿生講了這麼久,是時候講講與數字孿生強關聯的知識圖譜了。
於是,2019年,知識圖譜成為工業互聯網領域中的香饃饃。
工業互聯網中的這塊香饃饃漸漸浮現。
-
工業知識圖譜要具備哪些能力?
-
企業如何構建自己的知識圖譜?
-
製造業企業如何應用知識圖譜?
就這三個問題,雷鋒網在今年的杭州雲棲大會上,找到了阿里給出的答案。
需要具備什麼能力?
知識圖譜對於互聯網企業來說,其實不是一個新概念,包括百度的搜尋引擎,淘寶的推薦引擎都已經在應用知識圖譜。
互聯網應用中的知識圖譜是通過自下而上的方式構建的,通過業務數據的沉淀,大數據的積累,以一個持續構建、持續優化的過程逐漸構建起知識圖譜。
然而,這樣的構建方式在工業領域並不適用。
由於工業中包括檢修、預測等要求高精準的應用,專業領域特定場景應用數據量小,決定了工業知識圖譜的構建將是自上而下的一個過程——定義應用場景、定義問題、找到相應數據。
在杭州雲棲大會上, 阿里雲智能高級解決方案架構師劉志龍介紹稱。
工業知識圖譜需要具備怎樣的能力?
知識構建能力、知識抽取能力、知識輔助能力。
具體而言,包括:
知識構建能力,指工業場景中的本體設計。工業領域中做知識圖譜需要先設計本體,定義一個場景,需要定義知識本體,以及業務本體。
知識抽取能力。通過機器學習、深度學習、算法引擎等技術手段來進行知識抽取。
知識輔助能力。可以是智能搜尋、輔助推薦等能力,一線作業人員、設備,包括輔助設備如何智能修復,輔助工作人員作業、檢修、工廠盤點時解決具體問題。
劉志龍解釋稱,「在工業領域中的知識圖譜,關鍵點不是剛開始數據量有多大,而是找到場景的本體,構建數據抽取方式,從而構建知識圖譜體系,更關鍵的是如何讓一線工作人員將這套產品應用起來。」
基於這樣的理解,阿里構建了自己的工業知識圖譜產品矩陣。
從圖中可以看到,阿里這套產品體系有以下幾個關鍵點:
-
阿里構建的工業知識圖譜底層部署支持公有雲、私有雲、非雲化部署;
-
知識沉淀過程中會沉淀兩大內容,包括針對設備本體、故障圖譜、案例圖譜形成的知識庫,以及針對同義詞語、語料庫、規則模板資源庫;
-
圖譜管理、信息抽取分別配備了前台和後台,後台配備了諸如本體構建器、圖查詢引擎、事件抽取、知識推理等算法引擎,前台配備了圖譜可視化、圖譜拖拽、導入審核、規則配置、打標工具、規則審核等數據標註能力;
阿里在數據標註上的特點是半自動化標註,即在數據達到一定量時,可以自動進行數據標註。
-
上層場景定義中,阿里與行業合作夥伴進行了諸如設備故障診斷、行業標準智能問答、設備信息查詢助手等能力。
劉志龍也特別提到,「這些事情阿里不是只是自己在做,就業務角度而言,我們對業務的了解不如我們的生態企業、產業公司理解得更深入。」
知識圖譜怎麼建?
既然官方也指出,工業知識圖譜自上而下的構建思路與互聯網領域知識圖譜的構建不同,作為脫胎於互聯網時代的巨頭企業,阿里又對製造業產業了解並不深入。
那麼,阿里如何進行工業知識圖譜的構建呢?
阿里雲智能解決方案架構師古世相用一張架構圖給出了這個答案。
從這張圖中可以看到,整體架構分為三層:
-
底層是製造業企業中諸如設備、業務系統、人工經驗、技術文檔等各類數據源,這些數據源中的知識(高價值數據)通過圖像識別、AI算法等相關工具抽取出來,並向上匯聚;
-
中間層是數據抽取形成知識圖譜的過程,其中應用到了此前提到的各類算法引擎,並最終將專業知識、業務知識、經營知識等抽取出知識本體,以知識本體為框架,並通過規則引擎進行大數據的推理/挖掘,結合通用知識圖譜,構建起領域知識圖譜;
這一層也是阿里通過AI技術重點構建的部分,阿里為此打造了三個「底座引擎」,包括數據工廠、算法工廠、AI創作間,主要解決工業數據預處理與存儲、匯聚生產、智能應用三方面的能力。
知識圖譜怎麼用?
工業知識圖譜的是為了企業數字化轉型,為了企業或工廠實際應用而構建。因而,企業要首先發現自己現有業務問題,然後才是去考慮有什麼新技術可以解決這樣的問題。
現在的企業這方面做的還不好。
古世相在大會上表示。「很多傳統企業現在還是技術驅動,而其實,如何做需求驅動、業務驅動才是現在需要考慮的問題。」
知識圖譜的應用也是如此。
前文提到的工業知識圖譜構建中,最上一層是阿里針對具體應用場景構架的四項能力,包括智能搜尋與交互問答、精準數據處理、智能分析與決策、複雜關係挖掘推理。
以電力應用場景為例,
在製造業企業設備運維場景中,電力領域中最核心的資源是老專家,老專家積累了大量一線行業知識,將老專家的經驗搬到線上,把老專家沉淀的非結構化知識數據以知識圖譜串聯起來,當某一類問題出現和發生的時候,新員工或對專業知識不熟的人就可以通過這樣的知識圖譜快速解決問題。
在故障檢修應用場景中,老專家、老師傅將經驗和案例沉淀成文檔,阿里將這些知識搬到線上,構建了相應的知識圖譜,做到了在線分享。檢修人員可以通過手機APP在知識圖譜上可以查詢相關信息,包括什麼時間發生的類似故障,解決方案是什麼,甚至可以檢索到成功解決這一問題的老師傅是誰。
具體可以通過現場巡檢、在線監測、監控中心人工監測進行故障信息錄入,這些錄入的故障信息在AI決策工作台做故障判斷,此前構建的知識圖譜體系(包括案例和規則)都沉淀在AI決策中台,與此同時,還會通過試驗人員對故障問題進行試驗、測試,最終通過輔助決策,通過現場檢修人員解決,甚至直接下髮指令到設備,自動解決相關問題。
知識圖譜的進化之路
知識圖譜從互聯網領域遷移到工業互聯網領域,由於兩大領域場景差異較大,自下而上的知識圖譜構建思路也轉向自上而下。
就工業領域中構建的知識圖譜來看,可以分為兩類,一類是已有設備信息、生產信息的數字化知識圖譜,諸如將設備維護手冊、故障應用案例、一線專家經驗數字化,並構建相應的知識圖譜;另一類則是將設備信息、設備及數字化系統工作過程信息,甚至整個生產流程部分或全部數字化,並將其中不同垂直領域的數據關聯起來,構建相應的知識圖譜。
後者也正是當下數字孿生的概念。
由此也可見,智能製造、工業互聯網,最終要做到的企業數字化轉型、智能化轉型關鍵仍是將企業中各類設備、系統、數據打通,以數據驅動當下企業轉型升級。
在這個過程中,知識圖譜、數字孿生等中間概念或技術形態都將在數據驅動下持續迭代,逐漸覆蓋全流程、全生產要素,形成下一個時代製造業工廠的新形態。 雷鋒網雷鋒網 (公眾號:雷鋒網)
雷鋒網原創文章,未經授權禁止轉載。詳情見 轉載須知 。
>對製造業了解不深的阿里,如何構建工業知識圖譜?