最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

天然氣與管道技術標準本體庫構建方法

文檔序號:6489332閱讀:200來源:國知局
天然氣與管道技術標準本體庫構建方法
【專利摘要】本發(fā)明是一種天然氣與管道技術標準本體庫構建方法,涉及數字數據處理裝置和管道系統(tǒng)【技術領域】。其流程為:(1)確定本體的領域與范圍;(2)領域信息的收集和分析;(3)概念的確定;概念的確定中,要補充同義詞;(4)建立本體框架;(5)本體自定義集成,包括現有本體的引用,以及新本體的集成;(6)確定概念邏輯關系;確定概念邏輯關系時,要結合現有本體;(7)建立完整的本體表;(8)確認與評價;(9)進化;進化后參與(3)概念的確定和(6)確定概念邏輯關系;(10)完成本體建立。本發(fā)明所建立的本體庫能夠實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索。
【專利說明】天然氣與管道技術標準本體庫構建方法
【技術領域】
[0001]本發(fā)明是一種天然氣與管道技術標準本體庫構建方法,涉及數字數據處理裝置和管道系統(tǒng)【技術領域】。
【背景技術】
[0002]隨著信息技術與網絡技術的發(fā)展,信息共享系統(tǒng)已經在各個行業(yè)廣泛應用,大大提高了各行業(yè)工作勞動效率與便捷性,天然氣與管道行業(yè)在信息化技術應用方面一直走在行業(yè)前列,隨著業(yè)務、技術的進一步發(fā)展,僅僅提供文獻級別的檢索、瀏覽等功能已經不能滿足用戶的需求,必須進行更深一步的挖掘與服務,以滿足用戶需求。目前常用的標準檢索方式為“基本字段信息”檢索,一般僅能通過對標準名稱、主題詞進行檢索進而實現全文檢索,不能實現對技術指標的精確定位與檢索、不同標準中同一技術指標的對比。概括起來,傳統(tǒng)檢索方式對技術標準的使用效果有以下幾方面的局限性。
[0003](I)不能對技術標準內容進行精確檢索
[0004]傳統(tǒng)數據庫檢索方式是通過分類、標題、摘要及敘詞等手段對標準文獻進行題錄數據加工,來實現對技術標準與技術法規(guī)的檢索。但是技術指標一般會分散在不同技術標準與技術法規(guī)中,傳統(tǒng)的檢索方式只能通過題錄數據庫檢索到相關標準,逐一閱讀原文技術指標的內容。但是這樣的方法很浪費時間,并且難以保障查全率。
[0005](2)不能同時檢索到不同標準的技術指標,并實現不同標準的同一技術指標的對比。
[0006]在檢索過程中,經常會出現同一產品的技術指標同時存在國際標準、國家標準、行業(yè)標準、地方標準和企業(yè)標準等不同的標準中,用戶經常需要對不同標準中的相同產品的技術指標進行對比研究,這是傳統(tǒng)檢索方式所不能滿足的。
[0007]標準內容提取與展示系統(tǒng)是標準信息檢索的最新發(fā)展方向。這種新型的檢索方式通過對標準技術指標的系統(tǒng)提取和有效組織,能夠實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索。對于負責油氣管道工程建設的工程項目管理人員、實施人員,可以實現利用關鍵指標控制管道設計和施工建設;對于油氣管道運行操作人員、管理人員,可以實現查詢、對比操作參數、方法;對于科研人員,可以實現國內外標準關鍵指標差異分析、判斷技術差異,分析體系內各標準間的協調性。
[0008]CN102591878A公開了一種技術標準內容提取與展示系統(tǒng)的建立方法,《石油規(guī)劃設計》2011年第22卷第6期“天然氣與管道標準信息管理系統(tǒng)開發(fā)方案研究”公開了一種天然氣與管道標準信息管理系統(tǒng)的開發(fā)方案,但該系統(tǒng)僅能進行標準全文檢索,無法實現標準內容的提取與展示,也并未公開建立天然氣與管道標準本體庫的構建方法,其技術并不完善。
[0009]標準內容提取與展示技術是一種新的標準檢索技術,目前國外未見以此技術開發(fā)的商業(yè)數據庫。在國內,只有中國標準化研究院將標準內容提取與展示技術初步應用在食品、農產品的國家標準、行業(yè)標準中,并建設了相應的提取與展示系統(tǒng)平臺,實現對標準內容指標的提取與展示。目前國內外未見到天然氣與管道技術標準內容提取與展示系統(tǒng)的建立方法。
[0010]油氣管道標準本體庫就是標準化對象,能夠涵蓋天然氣與管道標準中出現的所有有效檢索對象,并可通過本體庫界定不同本體對象的位置以及他們之間的所屬關系,可以對標準內容指標的檢索起到支撐作用。
[0011]要實現天然氣與管道標準技術內容提取與展示就必須對技術標準中的標準對象進行歸納并明確各對象間的關系,進而形成統(tǒng)一的檢索規(guī)則以及能夠實現精確定位的有效檢索點集合。此外隨著天然氣與管道技術標準對業(yè)務的支撐作用越來越強以及標準是適用范圍越來越廣,建立統(tǒng)一、規(guī)范、完整的標準化對象即本體庫的成為用戶的迫切需求,并且將在天然氣與管道領域信息共享和集成過程中起到重要的作用。然而目前尚沒有現成的本體庫可用,且經檢索也沒有提取標準對象從而建立本體庫的有效的方法。
[0012]因此對天然氣與管道標準進行分解和核心標準對象的提取進而構建本體庫是實現標準內容提取與展示的基礎。

【發(fā)明內容】

[0013]本發(fā)明的目的是發(fā)明一種實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索、簡單易懂可行、能有效的分解、提取天然氣與管道標準對象、構建統(tǒng)一、完整的天然氣與管道技術標準本體庫構建方法。
[0014]本發(fā)明是天然氣與管道技術標準內容提取與展示系統(tǒng)中本體庫的構建方法,天然氣與管道技術標準內容提取與展示系統(tǒng)的建立方法如圖1所示,主要包括以下步驟:
[0015](I)使用光學字符識別(OCR)工具對天然氣與管道標準文獻全文進行數字化加工,使標準文獻數字化;
[0016](2)建立天然氣與管道標準本體庫、體例庫、題錄數據庫;
[0017](3)建立天然氣與管道標準內容數據庫;
[0018](4)開發(fā)天然氣與管道標準內容提取與展示系統(tǒng)平臺,用于標準內容提取、展示與對比。
[0019]具體建立步驟為:
[0020](I)按照標準文獻數字化規(guī)范,對確定的天然氣與管道標準進行全文數字化后,同時包括對文獻內容識別與質量審校,使標準可編輯,滿足提取與展示需求;
[0021](2)建立天然氣與管道標準本體庫、天然氣與管道標準題錄數據庫、天然氣與管道標準體例庫,這三個數據庫的建立為并列過程,互不干擾;
[0022]①建立天然氣與管道標準本體庫:對天然氣與管道標準主題概念進行分析歸納,針對主體類別的概念內涵,根據對專業(yè)知識的查詢結果和標準文獻中枚舉的標準化對象之間的從屬關系進行本體概念分析,明確標準中發(fā)生的概念體系及其層次關系,建立天然氣與管道標準本體庫;
[0023]②建立天然氣與管道體例庫:對天然氣與管道標準文獻進行分類,歸納標準的結構化信息;按照相同結構的標準文獻開展標準文獻體例分析,抽象出其中的核心概念及其特征描述術語,建立體例庫;
[0024]③天然氣與管道標準題錄數據庫:針對天然氣與管道技術標準進行標準技術指標分析歸納、對技術指標體系進行術語學與概念關系研究,進行技術指標概念的規(guī)范化及體系構建與標引,進行標準文獻技術指標標引,進行體例元素的分類與標示,建立標準技術指標數據庫,建立量與單位等輔助數據庫;以標準文本中的中文標準名稱、英文標準名稱、標準號、標準類型、【技術領域】技術方向、采用關系、代替關系、被代替關系、引用文獻、標準狀態(tài)、立項日期、發(fā)布日期、實施日期、確認日期、重要程度分級、歸口單位、起草單位、摘要、中文主題詞、英文主題詞、譯文、備注、正文等信息為基礎,建立標準題錄數據庫;
[0025](3)建立天然氣與管道標準內容數據庫
[0026]原有的標準體系表同步驟(2 )所建立本體庫、題錄數據庫、體例庫三個數據庫,形成天然氣與管道標準內容數據庫;
[0027](4)開發(fā)天然氣與管道標準內容提取與展示系統(tǒng)平臺,該系統(tǒng)除一般檢索系統(tǒng)功能外,如基本檢索功能、管理功能、在線反饋功能、幫助功能等功能,而且還應具有標準內容指標檢索功能、標準指標加工功能。
[0028]所述天然氣與管道標準本體庫構建流程如圖2所示,為:
[0029](I)確定本體的領域與范圍;
[0030](2)領域信息的收集和分析;
[0031](3)概念的確定;概念的確定中,要補充同義詞;
[0032](4)建立本體框架;
[0033](5)本體自定義集成,包括現有本體的引用,以及新本體的集成;
[0034](6)確定概念邏輯關系;確定概念邏輯關系時,要結合現有本體;
[0035]( 7 )建立完整的本體表;
[0036](8)確認與評價;
[0037](9)進化;進化后參與(3)概念的確定和(6)確定概念邏輯關系;
[0038]( 10)完成本體建立。
[0039]所述天然氣與管道標準本體庫構建流程具體為:
[0040](I)確定本體庫的領域與范圍:要明確構建的本體庫將覆蓋的專業(yè)領域、本體的目的、作用以及應用對象;
[0041](2)領域信息的收集和分析:通過收集石油天然氣管道領域信息充分了解該領域知識;信息來源包括專家、書籍、標準、網絡以及其它的本體;
[0042](3)概念的確定:在充分了解天然氣與管道領域知識之后,確定該領域中概念和概念之間的關系,用精確的術語表達出來,經領域專家的確認,作為領域本體的核心概念集?;緫摑M足的要求有:
[0043]①確定的概念及關系一定是領域相關的;領域的邊界往往是模糊的,需根據實際需求確定邊界包含的概念;
[0044]②采用的術語要精確,含義應具有唯一性;
[0045]③對每個術語有相應的自然語言描述和同義詞補充;
[0046](4)建立本體庫框架;對于步驟(3)中整理的領域中大量的概念,要按照一定的邏輯規(guī)則把它們進行分組,形成不同的小專業(yè)領域,在同一小工作領域的概念,其相關性應該比較強;另外,對其中的每一個概念的重要性要進行評估,選出關鍵性術語,摒棄那些不必要或者超出領域范圍的概念,盡可能準確而精簡的表達出領域的知識;[0047](5)本體庫自定義集成;在創(chuàng)建本體庫可以自定義,也可以是領域中現存的本體庫的重用;重用本體庫時,需要注意查看元本體庫,選擇和自己概念模型中的語義和實現一致的術語定義;其中涉及的關鍵技術是本體的映射;針對每個集成的本體庫,應確定其元本體庫、術語集、形式化的本體庫描述、以及集成在自己本體庫中的位置等屬性;
[0048](6)確定概念邏輯關系;主要以專業(yè)知識的與科學分類為基礎,根據分類學中的主題法和分類法,確定概念的邏輯關系;
[0049](7)建立完整的本體庫;將天然氣與管道標準本體庫與標準文獻有效檢索點結合,從而形成一個領域知識的框架體系,得到領域本體庫的框架結構;
[0050]建立天然氣與管道本體庫時,本體劃分應遵循以下基本規(guī)則:a)各子項的外延之和應等于母項的外延;b)劃分的各子項,其外延宜相互排斥;c)每次劃分應按同一原則進行;d)劃分應按層次逐級、由高到低、由簡到繁進行,宜結合天然氣與管道主營業(yè)務粗細結合;e)應持續(xù)更新補充;
[0051]類目的劃分與設置應突出主營業(yè)務,將內容相關性較大的類目,應盡量臨近設置;對于一些無專屬的類,且具有普遍指導意義的綜合性基礎標準可根據內容分別單獨設置類;上一層次類目的技術要求下層類目都要滿足;
[0052](8)確認與評價:本體庫應具有正確性、一致性、可擴展性和有效性;
[0053](9)進化:在使用過程中需要對本體庫不斷更新,本體庫進化的方式可以是集成新的本體庫或定義新的概念和關系;
[0054]( 10)完成本體庫建立。
[0055]本發(fā)明的有益效果:
[0056]本發(fā)明為天然氣與管道標準本體庫的構建方法取得了以下有益效果:
[0057](I)本發(fā)明簡單易懂可行,可以有效的分解、提取天然氣與管道標準對象,構建統(tǒng)一、完整的本體庫;
[0058](2)本發(fā)明構建的本體庫應用于天然氣與管道標準內容提取與展示系統(tǒng)可以作為有效檢索點的集合實現技術標準內容的精確定位和檢索,實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索;
[0059](3)本發(fā)明提取的本體精確、唯一、科學,可作為術語數據庫一部分,對天然氣與管道領域的信息共享與交流有重要作用。
【專利附圖】

【附圖說明】
[0060]圖1天然氣與管道標準內容提取與展示系統(tǒng)建立流程圖
[0061]圖2本體庫構建流程圖
【具體實施方式】
[0062]實施例.本例是一實驗方法,其流程如圖2所不。
[0063]本例主要包括以下步驟:
[0064](I)確定本體的領域與范圍;
[0065](2)領域信息的收集和分析;
[0066](3)概念的確定;概念的確定中,要補充同義詞;[0067](4)建立本體框架;
[0068](5)本體自定義集成,包括現有本體的引用,以及新本體的集成;
[0069](6)確定概念邏輯關系;確定概念邏輯關系時,要結合現有本體;
[0070]( 7 )建立完整的本體表;
[0071](8)確認與評價;
[0072](9)進化;進化后參與(3)概念的確定和(6)確定概念邏輯關系;
[0073](10)完成本體建立。
[0074]本例的體系表如下表:
[0075]表1本體表樣例
[0076]
【權利要求】
1.一種天然氣與管道技術標準本體庫構建方法,其特征是流程為: (1)確定本體的領域與范圍; (2)領域信息的收集和分析; (3)概念的確定;概念的確定中,要補充同義詞; (4)建立本體框架; (5)本體自定義集成,包括現有本體的引用,以及新本體的集成; (6)確定概念邏輯關系;確定概念邏輯關系時,要結合現有本體; (7)建立完整的本體表; (8)確認與評價; (9)進化;進化后參與(3)概念的確定和(6)確定概念邏輯關系; (10)完成本體建立。
2.根據權利要求1所述的天然氣與管道技術標準本體庫構建方法,其特征是構建流程具體為: (1)確定本體庫的領域與范圍:要明確構建的本體庫將覆蓋的專業(yè)領域、本體的目的、作用以及應用對象; (2)領域信息的收集和分析:通過收集石油天然氣管道領域信息充分了解該領域知識;信息來源包括專家、書籍、標準、網絡以及其它的本體; (3)概念的確定:在充分了解天然氣與管道領域知識之后,確定該領域中概念和概念之間的關系,用精確的術語表達出來,經領域專家的確認,作為領域本體的核心概念集?;緫摑M足的要求有: ①確定的概念及關系一定是領域相關的;領域的邊界往往是模糊的,需根據實際需求確定邊界包含的概念; ②采用的術語要精確,含義應具有唯一性; ③對每個術語有相應的自然語言描述和同義詞補充; (4)建立本體庫框架;對于步驟(3)中整理的領域中大量的概念,要按照一定的邏輯規(guī)則把它們進行分組,形成不同的小專業(yè)領域,在同一小工作領域的概念,其相關性應該比較強;另外,對其中的每一個概念的重要性要進行評估,選出關鍵性術語,摒棄那些不必要或者超出領域范圍的概念,盡可能準確而精簡的表達出領域的知識; (5)本體庫自定義集成;在創(chuàng)建本體庫可以自定義,也可以是領域中現存的本體庫的重用;重用本體庫時,需要注意查看元本體庫,選擇和自己概念模型中的語義和實現一致的術語定義;其中涉及的關鍵技術是本體的映射;針對每個集成的本體庫,應確定其元本體庫、術語集、形式化的本體庫描述、以及集成在自己本體庫中的位置等屬性; (6)確定概念邏輯關系;主要以專業(yè)知識的與科學分類為基礎,根據分類學中的主題法和分類法,確定概念的邏輯關系; (7)建立完整的本體庫;將天然氣與管道標準本體庫與標準文獻有效檢索點結合,從而形成一個領域知識的框架體系,得到領域本體庫的框架結構; 建立天然氣與管道本體庫時,本體劃分應遵循以下基本規(guī)則:a)各子項的外延之和應等于母項的外延;b)劃分的各子項,其外延宜相互排斥;c)每次劃分應按同一原則進行;d)劃分應按層次逐級、由高到低、由簡到繁進行,宜結合天然氣與管道主營業(yè)務粗細結合;e)應持續(xù)更新補充; 類目的劃分與設置應突出主營業(yè)務,將內容相關性較大的類目,應盡量臨近設置;對于一些無專屬的類,且具有普遍指導意義的綜合性基礎標準可根據內容分別單獨設置類;上一層次類目的技術要求下層類目都要滿足; (8)確認與評價:本體庫應具有正確性、一致性、可擴展性和有效性; (9)進化:在使用過程中需要對本體庫不斷更新,本體庫進化的方式可以是集成新的本體庫或定義新的概念和關系; (10)完成 本體庫 建立。
【文檔編號】G06F17/30GK103699542SQ201210366895
【公開日】2014年4月2日 申請日期:2012年9月28日 優(yōu)先權日:2012年9月28日
【發(fā)明者】劉冰, 姚學軍, 李云杰, 張欣, 稅碧垣, 劉艷雙, 鄭娟 申請人:中國石油天然氣股份有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1