- 相關(guān)推薦
基于本體的通用數(shù)據(jù)訪問方法
基于本體的通用數(shù)據(jù)訪問方法
摘 要 從數(shù)據(jù)使用者的角度,分析異構(gòu)數(shù)據(jù)資源的特征和用法,提出了基于本體的通用數(shù)據(jù)訪問方法和軟件架構(gòu),研究了此架構(gòu)所用到的關(guān)鍵技術(shù)。
基于本體的通用數(shù)據(jù)訪問系統(tǒng)的核心在于構(gòu)建出合適的統(tǒng)一數(shù)據(jù)描述模型,以此模型為基礎(chǔ),構(gòu)建數(shù)據(jù)訪問引擎,并通過抽取配置工具建立了數(shù)據(jù)描述模型與數(shù)據(jù)實(shí)體之間的映射關(guān)系,最終通過通用數(shù)據(jù)訪問軟件實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的統(tǒng)一訪問和展現(xiàn)。
【關(guān)鍵詞】異構(gòu)數(shù)據(jù) 本體 描述模型 映射 通用訪問
1 引言
隨著近年來網(wǎng)絡(luò)技術(shù)的快速發(fā)展,各領(lǐng)域之間數(shù)據(jù)共享的需求日益增強(qiáng),在網(wǎng)絡(luò)基礎(chǔ)設(shè)施日益完善的前提下,如何對不同行業(yè)和格式的數(shù)據(jù)資源進(jìn)行統(tǒng)一訪問和集成使用就成為了關(guān)鍵的問題。
國內(nèi)外對于異構(gòu)數(shù)據(jù)庫數(shù)據(jù)的集成近期提出了ETL(數(shù)據(jù)抽取、傳輸、加載)機(jī)制,在實(shí)現(xiàn)中采用XML(可擴(kuò)展標(biāo)記語言)實(shí)現(xiàn)通用的數(shù)據(jù)交換,利用全局邏輯視圖或者集成的綜合數(shù)據(jù)庫的方式實(shí)現(xiàn)對各類異構(gòu)數(shù)據(jù)資源的集成。
本文通過定義數(shù)據(jù)本體,設(shè)計了一種通用的數(shù)據(jù)訪問方法,建立不同的數(shù)據(jù)資源與本體之間的映射,使得綜合系統(tǒng)直接訪問各個異構(gòu)業(yè)務(wù)數(shù)據(jù)庫,從而提高數(shù)據(jù)的使用效率,降低數(shù)據(jù)冗余。
通用數(shù)據(jù)訪問面向的異構(gòu)數(shù)據(jù)具有海量、多元、復(fù)雜、動態(tài)、移動、實(shí)時等特征,為了更好的解決異構(gòu)數(shù)據(jù)資源的訪問、集成和展現(xiàn),在設(shè)計與實(shí)現(xiàn)通用數(shù)據(jù)訪問系統(tǒng)時,必須提供用戶對異構(gòu)數(shù)據(jù)源透明、一致和實(shí)時的訪問能力:
(1)透明性,是指屏蔽底層數(shù)據(jù)源的差異,從用戶的角度看來,得到的數(shù)據(jù)不是來自于若干個數(shù)據(jù)源,而是一個數(shù)據(jù)源;(2)一致性,是指消除數(shù)據(jù)源之間的存在的結(jié)構(gòu)異構(gòu)和語義異構(gòu);(3)實(shí)時性,是指訪問到的數(shù)據(jù)是最新的數(shù)據(jù),并且對數(shù)據(jù)庫中實(shí)時變化的信息能夠及時地捕獲與展現(xiàn)。
2 總體思路及架構(gòu)
基于本體的通用數(shù)據(jù)訪問方法面向圖形化的數(shù)據(jù)展現(xiàn),快速的從異構(gòu)數(shù)據(jù)資源中抽取出適用的對象,對其進(jìn)行統(tǒng)一管理,并借助地理信息系統(tǒng)或表單顯示工具向用戶提供清晰直觀的數(shù)據(jù)展現(xiàn)。
其主要解決異構(gòu)數(shù)據(jù)的統(tǒng)一使用問題,在避免數(shù)據(jù)格式轉(zhuǎn)換帶來大量工作的前提下,實(shí)現(xiàn)數(shù)據(jù)的動態(tài)加載,保證應(yīng)用系統(tǒng)與底層數(shù)據(jù)資源的分離,同時具有良好的擴(kuò)展性,在數(shù)據(jù)種類發(fā)生變化時,只需要通過工具界面配置,就能夠快速加載新增的數(shù)據(jù)資源。
基于本體的通用數(shù)據(jù)訪問方法采用分層的體系結(jié)構(gòu),下層軟件給上層軟件提供運(yùn)行支撐或輸入,共分為四層,從底到頂分別是:本體定義及管理層、元數(shù)據(jù)映射層、數(shù)據(jù)訪問層和數(shù)據(jù)展現(xiàn)層。
2.1 本體定義及管理層
本體定義及管理層主要負(fù)責(zé)建立基于本體的統(tǒng)一數(shù)據(jù)描述模型,并制訂出一套對該數(shù)據(jù)描述模型的訪問接口規(guī)范,是整個方法實(shí)現(xiàn)的核心和基礎(chǔ)。
2.2 元數(shù)據(jù)映射層
元數(shù)據(jù)映射層主要實(shí)現(xiàn)數(shù)據(jù)的靈活配置,通過人工界面配置的手段在數(shù)據(jù)庫元數(shù)據(jù)與統(tǒng)一數(shù)據(jù)描述模型之間建立對應(yīng)關(guān)系,并把映射關(guān)系保存為XML文件,供通用數(shù)據(jù)訪問軟件讀取。
2.3 數(shù)據(jù)訪問層
數(shù)據(jù)訪問層主要完成對數(shù)據(jù)庫中實(shí)際數(shù)據(jù)的讀取和輸出。
通用數(shù)據(jù)訪問軟件在實(shí)現(xiàn)時遵循本體定義及描述層制訂的規(guī)范,內(nèi)部的數(shù)據(jù)組織關(guān)系來自于元數(shù)據(jù)庫映射層生成的映射關(guān)系XML文件。
2.4 數(shù)據(jù)展現(xiàn)層
數(shù)據(jù)展現(xiàn)層主要包括兩種展現(xiàn)手段:基于地理信息的圖形化顯示工具和表格形式的表單顯示工具。
數(shù)據(jù)展現(xiàn)層屬于業(yè)務(wù)應(yīng)用范疇,主要需要考慮的是基于地理信息系統(tǒng)(GIS)的數(shù)據(jù)表現(xiàn)以及海量數(shù)據(jù)高性能顯示的問題,與通用數(shù)據(jù)訪問的實(shí)現(xiàn)沒有直接關(guān)系,因此在本文中不對這部分的實(shí)現(xiàn)進(jìn)行討論。
3 關(guān)鍵技術(shù)及實(shí)現(xiàn)
3.1 統(tǒng)一數(shù)據(jù)描述模型
統(tǒng)一數(shù)據(jù)描述模型的內(nèi)容包括圖層公共信息(本體)和特征屬性族,各類異構(gòu)的數(shù)據(jù)在按照統(tǒng)一數(shù)據(jù)描述模型表述為本體和特征屬性族的過程中,消除其原有的異構(gòu)性,形成統(tǒng)一的數(shù)據(jù)表述。
統(tǒng)一數(shù)據(jù)描述模型主要由圖層公共信息和一組特征屬性族組成。
統(tǒng)一數(shù)據(jù)描述模型確定種類繁多的數(shù)據(jù)信息之間存在的內(nèi)在共同點(diǎn),建立圖層公共信息的統(tǒng)一描述。
圖層公共信息:
其中標(biāo)識屬性、空間位置屬性、時間屬性以及符號屬性,這幾個屬性的組合體現(xiàn)了數(shù)據(jù)對象在全維圖形上的基本價值。
在統(tǒng)一數(shù)據(jù)描述模型中除了建立統(tǒng)一的圖層公共信息描述以外,還借鑒可擴(kuò)展標(biāo)記語言的思想,建立了一個對象特征屬性族描述方法,用來存放每類數(shù)據(jù)對象的具體屬性項(xiàng)。
該屬性族由數(shù)據(jù)對象的類型確定,其可擴(kuò)展的特性保證了每一類數(shù)據(jù)對象信息項(xiàng)的完整,同一類對象屬性族項(xiàng)的數(shù)量和構(gòu)成保持一致。
特征屬性族定義:
3.2 數(shù)據(jù)圖層映射轉(zhuǎn)換
采用根據(jù)數(shù)據(jù)庫中字段的取值確定圖層對象的動態(tài)映射機(jī)制,并提供多種方法來規(guī)范映射,提供了語義映射機(jī)制,通過將數(shù)據(jù)庫字段與統(tǒng)一數(shù)據(jù)描述模型中的屬性建立字段映射機(jī)制;采用數(shù)據(jù)庫數(shù)據(jù)到圖層對象的語義映射,提供量綱映射機(jī)制,通過規(guī)范數(shù)據(jù)庫中數(shù)據(jù)到圖層對象的取值處理標(biāo)準(zhǔn),提供多種量綱轉(zhuǎn)換機(jī)制,如經(jīng)緯度的轉(zhuǎn)換機(jī)制和時間格式轉(zhuǎn)換機(jī)制等等;采用字段映射機(jī)制或條件映射機(jī)制來處理圖層顯示屬性。
如果顯示屬性采用字段映射機(jī)制進(jìn)行配置處理,那么將使用配置字段的取值進(jìn)行顯示處理;如果顯示屬性采用條件映射機(jī)制進(jìn)行配置,那么在進(jìn)行顯示處理時,將對這組字段的取值進(jìn)行判斷,符合某組合的取值,則用該組合的設(shè)置值進(jìn)行顯示,沒有符合的條件組合就是用默認(rèn)值進(jìn)行顯示。
4 結(jié)束語
本文的研究對象主要是針對數(shù)據(jù)庫形態(tài)的數(shù)據(jù)資源,而文中提出的方法對其他形態(tài)的數(shù)據(jù)資源也同樣適用,因此,后續(xù)的工作將以建立各種形態(tài)數(shù)據(jù)資源統(tǒng)一訪問的軟件系統(tǒng)為目標(biāo)。
參考文獻(xiàn)
[1]繆嘉嘉,鄧蘇,劉青寶.E T L綜述計算機(jī)工程,2004(2).
[2]沈鐳.基于XML的異質(zhì)多數(shù)據(jù)庫集成系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J].河南大學(xué)學(xué)報(自然科學(xué)版),2007(9):530-532.
[3]吳姍姍,彭向陽.基于XML的通用數(shù)據(jù)庫訪問引擎的設(shè)計與實(shí)現(xiàn)[J].指揮信息系統(tǒng)與技術(shù),2010(01).
【基于本體的通用數(shù)據(jù)訪問方法】相關(guān)文章:
基于角色訪問控制的OA系統(tǒng)的設(shè)計與實(shí)現(xiàn)10-26
基于Excel的數(shù)據(jù)加密方案的論文范文10-07
基于學(xué)習(xí)目的的學(xué)習(xí)方法10-05
基于Web Service的物聯(lián)網(wǎng)數(shù)據(jù)平臺的設(shè)計與實(shí)現(xiàn)10-06
基于旅游管理的時空數(shù)據(jù)模型研究論文10-08
excel數(shù)據(jù)引用公式的使用方法10-26
基于運(yùn)動捕獲數(shù)據(jù)的三維角色動畫設(shè)計10-26
基于.NET的管道SCADA維護(hù)數(shù)據(jù)管理系統(tǒng)的設(shè)計與實(shí)現(xiàn)10-26