重要參考:電子政務四大基礎數據庫融合設計研究

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

2002年7月,國家信息化主管小組辦公室制定了《大陸電子政務一期工程建設方案》,該方案確定了「十五」期間重點建設的四大基礎性、戰略性資源數據庫,首次明確建設人口、法人單位、自然資源和空間地理、宏觀經濟四大基礎信息數據庫,以加強政務資源的整合、共享與交換,提高電子政務建設水平,避免重復建設。近年來,隨著電子政務建設與應用的全面展開,各省、市、地區都陸續開展了四大基礎數據庫建設工作,相關成果已經廣泛服務於政府、部門和社會公眾,取得了較好的社會、經濟效益。

四大數據庫是一個有機聯繫的整體,全面表達了從自然到社會的整個人類活動,是各級政府部門在管理社會事務和經濟發展過程中產生的最基礎的政務信息資源。但是,由於當前四大基礎數據庫的建設是由不同的牽頭單位單獨建設,受進度、技術、環境、體制等因素影響,現有四大基礎數據庫的服務還僅限於四大基礎數據庫本身的領域,暫時未能做到庫之間的融合集成,無法進行庫與庫之間的數據挖掘,信息應用深度和廣度有限,無法滿足政府主管多角度的決策需求和各業務部門複雜應用需求,主要表現在:

1.1 服務模式還相對單一,服務能力相對薄弱

目前,人口庫、法人庫、宏觀庫的主要服務模式主要包括傳統的數據分發模式和應用系統查詢模式,這兩種模式信息均存在一定的局限性:數據分發服務模式需要向用戶提供實體數據,存在數據版本過多、無法更新聯動、信息整合困難、安全保密隱患等諸多數據問題,容易造成信息孤島;應用系統查詢模式能夠滿足用戶的一些程式化的應用需求,使用方式較為單一,用戶無法根據業務需求進行擴充,無法滿足自定義擴展的應用需求。

1.2 資源提供比較單一、信息綜合集成度較差

由於四大基礎數據庫是由不同單位單獨承建,其現有的服務基本處於單向應用階段,未能做到數據庫之間的信息綜合查詢,信息綜合集成度差:比如無法獲取法人所對應的自然人的健康、教育等相關信息,也無法通過某個人的信息獲取其關聯的社會、經濟的相關信息等等。

1.3 信息挖掘不夠深入,空間特性應用不足

目前對四大基礎數據庫信息的使用還僅僅是從自身的維度上開展工作,對信息的挖掘深度不夠,未能做到對信息之間特別是與地理信息的信息挖掘和分析:比如無法做到專題信息的空間定位,無法做到專題信息的空間分析和決策分析。因此,迫切需要開展四大基礎數據庫融合工作,做到人口數據、法人數據、地理空間數據和宏觀經濟數據的集成分析和協同服務,擴大政務基礎信息應用的廣度和深度,滿足政府主管多角度的決策需求和行業部門綜合信息應用需求。

針對上述需求,本文提出了基礎信息資源融合的思路,並在此基礎上,以四大基礎數據庫為例,設計了四大基礎數據庫融合模型,並從融合的應用模式、服務方式、訪問控制等方面開展深入研究。

基礎信息資源融合思路

世界上75%到80%的信息都與地理信息有關,地理信息作為所有信息的空間定位基礎,是信息整合的關鍵。為此,基礎信息資源的數據融合可以以地理信息為基礎和紐帶,建立一個包含所有基礎信息資源的「數據中心」,以做到各類信息的關聯和集成。

2.1 數據存儲模式

基礎資源信息融合需要做到各類基礎數據的集中管理和分析,可以採取物理集中和邏輯集中兩種存儲模式。其中,物理集中是將全部數據集中放在一起,其優點是數據訪問方便、訪問效率高,缺點是對數據庫壓力大,涉及各部門的利益,現有業務整合困難;邏輯集中通過相關的元數據、目錄,做到一個全局的邏輯視圖,建立一個虛擬的「數據中心」,通過統一的一個平台做到分布式數據的互聯互通,其優點是對原有業務影響小,不影響各部門的原有業務,缺點是對各節點的標準化程度高,系統的訪問效率收到網路傳輸能力的限制。根據現有基礎信息資源的管理現狀,宜採用「物理分布、邏輯集中」的構建模式。

2.2 數據存儲內容

數據存儲內容方面,「數據中心」應存儲各類基礎數據資源的元數據、目錄以及數據之間的映射關係,通過這些信息,將物理分散的數據邏輯集中在一起,以構建基礎信息資源的目錄體系,並基於一個統一的全局視圖對外提供。

2.3 現有數據改造

按照「物理分布、邏輯集中」的構建模式,需要開展各基礎信息庫的標準化改造工作。各基礎信息庫應按照統一的標準,擴展、開發形成一系列WebService接口,包括數據獲取、數據同步、權限控制等,以支撐模型的構建。

此外,為支撐模型的應用需求,做到基礎資源的管理、關聯、集成和同步,需要構建一套數據融合工具集,做到從數據關聯、數據配置、數據擴充、數據同步、服務分配等一系列可視化的管理和分配[5]。按照上述理論,制定基礎信息資源的融合模型如圖1所示:

重要參考:電子政務四大基礎數據庫融合設計研究

在上圖中,通過提供一套數據融合工具集,基於地理信息的空間定位基礎,建立一個虛擬的「數據中心」,通過數據的元數據、目錄及數據之間的映射關係,基於SOA的服務模式,集成各類信息資源的服務,做到各類基礎信息資源的融合和協同服務。

四大基礎數據庫融合設計

人口、法人、宏觀經濟、地理作為政務信息中最基礎、最重要的信息資源,其信息之間的融合是基礎信息資源融合的核心,本部分以前面構建的融合模型為基礎,結合人口庫、法人庫、宏觀經濟庫的建設特點和應用現狀,開展四大基礎數據庫的融合設計和構建。

3.1融合模型建立

首先,四大基礎數據庫融合需要建立一個融合庫(數據中心),存儲用於支撐融合的相關數據,融合庫中需要存儲以下信息資源:

1)元數據和目錄數據

存儲人口、法人、宏觀經濟的相關元數據和目錄數據,以便做到統一管理和服務。

2)基礎庫的「主鍵」數據和映射關係

融合庫應當存儲人口庫、法人庫、宏觀經濟庫中的「主鍵」數據,如包含居民身份證的人口基本數據項、包含組織機構代碼的法人基本項,為做到信息的關聯奠定基礎;此外,應當存儲不同庫相關數據之間的映射關係,如地理庫與人口庫行政區劃編碼的關係,地理庫與法人庫地名地址的關係等。

3)其他數據

針對融合應用需求,融合庫中還需要存儲一系列預先設計好的統計信息,如統計信息,人口離散化信息等。其次,為了做到數據融合,需要四大基礎數據庫牽頭部門在現有四大基礎數據庫的基礎上,按照統一標準、統一控制的要求,擴展、開發形成一系列WebService接口,做到基礎數據到融合數據的提取、統計和同步。結合人口庫、法人庫、宏觀經濟庫和地理庫的特點,四大基礎數據庫關聯關係構建思路如圖2所示:

重要參考:電子政務四大基礎數據庫融合設計研究

在上圖中,人口庫提供了包括自然特徵、家庭特徵,地理特徵、社會特徵和經濟特徵相關信息,通過其地理特徵(行政區劃編碼),可以做到與地理庫的關聯,通過經濟特徵(組織機構代碼),可以做到與法人庫的集成,此外,通過人口數據的離散化操作,可以獲取人口數據的空間分布規律;法人庫中包括了基本信息、註冊登記信息、組織機構代碼信息和稅務信息,通過地理特徵(行政區劃編碼),可以做到法人數據的空間化,通過人口身份信息,可以獲得人口的基本信息;宏觀經濟庫作為各類宏觀信息的統計匯總,一方面由人口、法人的統計信息匯總而來,另一方面,可以通過行政區劃編碼做到與地理空間的掛接。最終,通過以地理庫的地理信息數據為依托,以各基礎數據庫的相關關鍵屬性為紐帶,做到四大基礎數據庫之間的數據交叉融合和集成應用。

3.2 應用模式設計

應用模式方面,四大基礎數據庫融合不是對原有四大基礎數據庫角色和功能的取代和替換,而是通過融合,對四大基礎數據庫各自服務能力進行補充和完善,同時,做到四大基礎數據庫信息之間的協同服務分析,豐富、擴展四大基礎數據庫應用的廣度和深度,使得信息的利用最大化。四大基礎數據庫的應用模式如圖3所示:

重要參考:電子政務四大基礎數據庫融合設計研究

一方面,四大基礎數據庫各自原有的服務模式不變,包括四大基礎數據庫的庫體結構不變、功能模塊不變以及應用場景不變,各基礎數據庫依然沿用以前的方式對外提供服務;同時,根據四大基礎數據庫融合的需求,通過對四大基礎庫進行更新和改造,反過來還能提升四大基礎數據庫本身的服務水平。

另一方面,通過開展四大基礎數據庫融合工作,基於「一張圖」信息資源整合模式,通過數據標準化、地理匹配、關聯映射等操作,做到各類信息的地理化,基於融合服務引擎對外提供一套四大基礎數據庫融合服務,能夠極大地提升四大基礎數據庫應用的廣度和深度,滿足政府主管、行業部門對政務綜合信息服務的應用需求。

3.3 服務方式設計

四大基礎數據庫融合的最終應用群體為政府主管和相關行業部門。為了滿足用戶多層次、多角度的應用需求,四大基礎數據庫融合提供門戶網站和應用接口兩種服務方式。

1)門戶網站服務模式

各級用戶可使用瀏覽器通過網路直接訪問四大基礎數據庫融合的門戶網站,通過網路在線的方式在線應用各種服務和功能。用戶通過門戶網站,能夠方便了解四大基礎數據庫融合的各類成果和服務,能夠查看各類融合專題圖,能夠做到四大基礎數據庫信息的綜合查詢及基於地理空間的四大基礎數據庫綜合信息輔助分析,滿足用戶對四大基礎數據庫綜合信息的瀏覽、查詢和輔助分析需求。

2)應用接口服務模式

應用接口服務模式提供一系列符合規範的WebService接口,包括信息查詢、統計圖表展示和目錄等接口。用戶可基於這些接口,根據需求進行靈活開發,做到綜合信息查詢、空間輔助分析等個性化功能。

3.4訪問控制設計

由於四大基礎數據庫的數據具有保密特性,因此,應該建立一套完整的信息安全體系,保證數據的安全性。

根據四大基礎數據庫融合的融合模型,用戶的服務響應涉及融合層和基礎層兩層的響應,為此,四大基礎數據庫融合採取融合層和基礎數據層兩級訪問控制模型,以確保數據的安全性:其中,融合層的控制側重於對服務的控制,通過對用戶身份進行認證,做到服務層次的轉PO和拒絕;基礎數據層的控制側重於對數據的控制,做到數據表、數據字段和數據內容的訪問控制;兩級控制應以基礎層的控制為主,融合層的控制為輔。四大基礎數據庫融合的訪問控制模型如圖4所示:

重要參考:電子政務四大基礎數據庫融合設計研究

在上圖中,通過兩級訪問控制模型,用戶訪問經過兩層過濾和分級控制,最終獲取有權限的數據:首先,在融合層,通過對用戶的身份進行認證,判斷其是否具有訪問某服務的權限,如果沒有則直接拒絕,如果有的話則將服務請求分配到指定的基礎數據層;然後,在基礎層,通過對用戶的身份驗證,確定用戶能訪問的表、字段和內容,並將合適的數據返回給融合層,統一對外提供給用戶,確保特定用戶能訪問特定的信息。

結束語

政務信息化建設的最終目的不是以行業為單位完成內部信息整合,而是全部政務信息的融合和應用,最終提高政務信息資源的利用率,最大限度地做到資源共享和業務協同。本文緊密結合政務信息資源綜合應用的需求,在顧及四大基礎數據庫原有服務模式的基礎上,提出了四大基礎數據庫信息融合的思路和模型,開展了數據融合模型、應用模式、服務方式等關鍵技術的研究。這種思路可以不局限於當前的四大基礎數據庫,而且可以擴展到整個政務信息資源的大融合。後續將在上述邏輯設計的基礎上跟蹤開展政務信息融合的研究與原型做到,為真正做到政務信息融合提供支持。

來源:《學術研究·測繪技術裝備》

作者:曹建成 王凱 王乃生 郭朝陽

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!