最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法

文檔序號:6489327閱讀:225來源:國知局
天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法
【專利摘要】本發(fā)明是一種天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法,涉及數(shù)字數(shù)據(jù)處理裝置和管道系統(tǒng)【技術(shù)領(lǐng)域】。它主要包括以下步驟:(1)使用光學(xué)字符識別(OCR)工具對天然氣與管道標(biāo)準(zhǔn)文獻全文進行數(shù)字化加工,使標(biāo)準(zhǔn)文獻數(shù)字化;(2)建立天然氣與管道標(biāo)準(zhǔn)本體庫、體例庫、題錄數(shù)據(jù)庫;(3)建立天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫;(4)開發(fā)天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)平臺,用于標(biāo)準(zhǔn)內(nèi)容提取、展示與對比。本發(fā)明所建立的系統(tǒng)能夠?qū)崿F(xiàn)從“基本字段信息”到“重要技術(shù)指標(biāo)”的高效的標(biāo)準(zhǔn)信息檢索。
【專利說明】天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是一種天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法,涉及數(shù)字數(shù)據(jù)處理裝置和管道系統(tǒng)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]隨著信息技術(shù)與網(wǎng)絡(luò)技術(shù)的發(fā)展,信息共享系統(tǒng)已經(jīng)在各個行業(yè)廣泛應(yīng)用,大大提高了各行業(yè)工作勞動效率與便捷性,天然氣與管道行業(yè)在信息化技術(shù)應(yīng)用方面一直走在行業(yè)前列,隨著業(yè)務(wù)、技術(shù)的進一步發(fā)展,僅僅提供文獻級別的檢索、瀏覽等功能已經(jīng)不能滿足用戶的需求,必須進行更深一步的挖掘與服務(wù),以滿足用戶需求。目前常用的標(biāo)準(zhǔn)檢索方式為“基本字段信息”檢索,一般僅能提供對標(biāo)準(zhǔn)名稱、主題詞進行檢索,不能實現(xiàn)對技術(shù)指標(biāo)的精確定位與檢索、不同標(biāo)準(zhǔn)中同一技術(shù)指標(biāo)的對比。概括起來,傳統(tǒng)檢索方式對技術(shù)標(biāo)準(zhǔn)的使用效果有以下幾方面的局限性。
[0003](I)不能對技術(shù)標(biāo)準(zhǔn)內(nèi)容進行精確檢索
[0004]傳統(tǒng)數(shù)據(jù)庫檢索方式是通過分類、標(biāo)題、摘要及敘詞等手段對標(biāo)準(zhǔn)文獻進行題錄數(shù)據(jù)加工,來實現(xiàn)對技術(shù)標(biāo)準(zhǔn)與技術(shù)法規(guī)的檢索。但是技術(shù)指標(biāo)一般會分散在不同技術(shù)標(biāo)準(zhǔn)與技術(shù)法規(guī)中,傳統(tǒng)的檢索方式只能通過題錄數(shù)據(jù)庫檢索到相關(guān)標(biāo)準(zhǔn),逐一閱讀原文技術(shù)指標(biāo)的內(nèi)容。但是這樣的方法很浪費時間,并且難以保障查全率。
[0005](2)不能同時檢索到不同標(biāo)準(zhǔn)的技術(shù)指標(biāo),并實現(xiàn)不同標(biāo)準(zhǔn)的同一技術(shù)指標(biāo)的對比。
[0006]在檢索過程中,經(jīng)常會出現(xiàn)同一產(chǎn)品的技術(shù)指標(biāo)同時存在國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)等不同的標(biāo)準(zhǔn)中,用戶經(jīng)常需要對不同標(biāo)準(zhǔn)中的相同產(chǎn)品的技術(shù)指標(biāo)進行對比研究,這是傳統(tǒng)檢索方式所不能滿足的。
[0007]標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)是標(biāo)準(zhǔn)信息檢索的最新發(fā)展方向。這種新型的檢索方式通過對標(biāo)準(zhǔn)技術(shù)指標(biāo)的系統(tǒng)提取和有效組織,能夠?qū)崿F(xiàn)從“基本字段信息”到“重要技術(shù)指標(biāo)”的高效的標(biāo)準(zhǔn)信息檢索。對于負責(zé)油氣管道工程建設(shè)的工程項目管理人員、實施人員,可以實現(xiàn)利用關(guān)鍵指標(biāo)控制管道設(shè)計和施工建設(shè);對于油氣管道運行操作人員、管理人員,可以實現(xiàn)查詢、對比操作參數(shù)、方法;對于科研人員,可以實現(xiàn)國內(nèi)外標(biāo)準(zhǔn)關(guān)鍵指標(biāo)差異分析、判斷技術(shù)差異,分析體系內(nèi)各標(biāo)準(zhǔn)間的協(xié)調(diào)性。
[0008]CN102591878A公開了一種技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法,《石油規(guī)劃設(shè)計》2011年第22卷第6期“天然氣與管道標(biāo)準(zhǔn)信息管理系統(tǒng)開發(fā)方案研究”公開了一種天然氣與管道標(biāo)準(zhǔn)信息管理系統(tǒng)的開發(fā)方案,但該系統(tǒng)僅能進行標(biāo)準(zhǔn)全文檢索,無法實現(xiàn)標(biāo)準(zhǔn)內(nèi)容的提取與展示,也并未公開建立天然氣與管道標(biāo)準(zhǔn)本體庫、體例庫、題錄數(shù)據(jù)庫的方法,其技術(shù)并不完善。
[0009]標(biāo)準(zhǔn)內(nèi)容提取與展示技術(shù)是一種新的標(biāo)準(zhǔn)檢索技術(shù),目前國外未見以此技術(shù)開發(fā)的商業(yè)數(shù)據(jù)庫。在國內(nèi),只有中國標(biāo)準(zhǔn)化研究院將標(biāo)準(zhǔn)內(nèi)容提取與展示技術(shù)初步應(yīng)用在食品、農(nóng)產(chǎn)品的國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)中,并建設(shè)了相應(yīng)的提取與展示系統(tǒng)平臺,實現(xiàn)對標(biāo)準(zhǔn)內(nèi)容指標(biāo)的提取與展示。而天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法也不完
口 O

【發(fā)明內(nèi)容】

[0010]本發(fā)明的目的是發(fā)明一種建立的系統(tǒng)能夠?qū)崿F(xiàn)從“基本字段信息”到“重要技術(shù)指標(biāo)”的高效的標(biāo)準(zhǔn)信息檢索的天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法。
[0011]本發(fā)明如圖1的技術(shù)路線所示,主要包括以下步驟:
[0012](I)使用光學(xué)字符識別(OCR)工具對天然氣與管道標(biāo)準(zhǔn)文獻全文進行數(shù)字化加工,使標(biāo)準(zhǔn)文獻數(shù)字化;
[0013](2)建立天然氣與管道標(biāo)準(zhǔn)本體庫、體例庫、題錄數(shù)據(jù)庫;
[0014](3)建立天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫;
[0015](4)開發(fā)天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)平臺,用于標(biāo)準(zhǔn)內(nèi)容提取、展示與對比。
[0016]具體建立步驟為:
[0017](I)按照標(biāo)準(zhǔn)文獻數(shù)字化規(guī)范,對確定的天然氣與管道標(biāo)準(zhǔn)進行全文數(shù)字化后,同時包括對文獻內(nèi)容識別與質(zhì)量審校,使標(biāo)準(zhǔn)可編輯,滿足提取與展示需求;
[0018](2)建立天然氣與管道標(biāo)準(zhǔn)本體庫、天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫、天然氣與管道標(biāo)準(zhǔn)體例庫,這三個數(shù)據(jù)庫的建立為并列過程,互不干擾;
[0019]①建立天然氣與管道標(biāo)準(zhǔn)本體庫:對天然氣與管道標(biāo)準(zhǔn)主題概念進行分析歸納,針對主體類別的概念內(nèi)涵,根據(jù)對專業(yè)知識的查詢結(jié)果和標(biāo)準(zhǔn)文獻中枚舉的標(biāo)準(zhǔn)化對象之間的從屬關(guān)系進行本體概念分析,明確標(biāo)準(zhǔn)中發(fā)生的概念體系及其層次關(guān)系,建立天然氣與管道標(biāo)準(zhǔn)本體庫;
[0020]②建立天然氣與管道體例庫:對天然氣與管道標(biāo)準(zhǔn)文獻進行分類,歸納標(biāo)準(zhǔn)的結(jié)構(gòu)化信息;按照相同結(jié)構(gòu)的標(biāo)準(zhǔn)文獻開展標(biāo)準(zhǔn)文獻體例分析,抽象出其中的核心概念及其特征描述術(shù)語,建立體例庫;
[0021]③天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫:針對天然氣與管道技術(shù)標(biāo)準(zhǔn)進行標(biāo)準(zhǔn)技術(shù)指標(biāo)分析歸納、對技術(shù)指標(biāo)體系進行術(shù)語學(xué)與概念關(guān)系研究,進行技術(shù)指標(biāo)概念的規(guī)范化及體系構(gòu)建與標(biāo)引,進行標(biāo)準(zhǔn)文獻技術(shù)指標(biāo)標(biāo)引,進行體例元素的分類與標(biāo)示,建立標(biāo)準(zhǔn)技術(shù)指標(biāo)數(shù)據(jù)庫,建立量與單位等輔助數(shù)據(jù)庫;以標(biāo)準(zhǔn)文本中的中文標(biāo)準(zhǔn)名稱、英文標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)號、標(biāo)準(zhǔn)類型、【技術(shù)領(lǐng)域】技術(shù)方向、采用關(guān)系、代替關(guān)系、被代替關(guān)系、引用文獻、標(biāo)準(zhǔn)狀態(tài)、立項日期、發(fā)布日期、實施日期、確認日期、重要程度分級、歸口單位、起草單位、摘要、中文主題詞、英文主題詞、譯文、備注、正文等信息為基礎(chǔ),建立標(biāo)準(zhǔn)題錄數(shù)據(jù)庫;
[0022](3)建立天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫
[0023]原有的標(biāo)準(zhǔn)體系表同步驟(2 )所建立本體庫、題錄數(shù)據(jù)庫、體例庫三個數(shù)據(jù)庫,形成天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫;
[0024](4)開發(fā)天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)平臺,該系統(tǒng)除一般檢索系統(tǒng)功能外,如基本檢索功能、管理功能、在線反饋功能、幫助功能等功能,而且還應(yīng)具有標(biāo)準(zhǔn)內(nèi)容指標(biāo)檢索功能、標(biāo)準(zhǔn)指標(biāo)加工功能。
[0025]所述天然氣與管道標(biāo)準(zhǔn)本體庫構(gòu)建流程如圖2所示,為:[0026](I)確定本體的領(lǐng)域與范圍;
[0027](2)領(lǐng)域信息的收集和分析;
[0028](3)概念的確定;概念的確定中,要補充同義詞;
[0029](4)建立本體框架;
[0030](5)本體自定義集成,包括現(xiàn)有本體的引用,以及新本體的集成;
[0031](6)確定概念邏輯關(guān)系;確定概念邏輯關(guān)系時,要結(jié)合現(xiàn)有本體;
[0032]( 7 )建立完整的本體表;
[0033](8)確認與評價;
[0034](9)進化;進化后參與(3)概念的確定和(6)確定概念邏輯關(guān)系;
[0035]( 10)完成本體建立。
[0036]所述天然氣與管道標(biāo)準(zhǔn)本體庫構(gòu)建流程具體為:
[0037](I)確定本體庫的領(lǐng)域與范圍:要明確構(gòu)建的本體庫將覆蓋的專業(yè)領(lǐng)域、本體的目的、作用以及應(yīng)用對象;
[0038](2)領(lǐng)域信息的收集和分析:通過收集石油天然氣管道領(lǐng)域信息充分了解該領(lǐng)域知識;信息來源包括專家、書籍、標(biāo)準(zhǔn)、網(wǎng)絡(luò)以及其它的本體;
[0039](3)概念的確定:在充分了解天然氣與管道領(lǐng)域知識之后,確定該領(lǐng)域中概念和概念之間的關(guān)系,用精確的術(shù)語表達出來,經(jīng)領(lǐng)域?qū)<业拇_認,作為領(lǐng)域本體的核心概念集?;緫?yīng)該滿足的要求有:
[0040]①確定的概念及關(guān)系一定是領(lǐng)域相關(guān)的;領(lǐng)域的邊界往往是模糊的,需根據(jù)實際需求確定邊界包含的概念;
[0041]②采用的術(shù)語要精確,含義應(yīng)具有唯一性;
[0042]③對每個術(shù)語有相應(yīng)的自然語言描述和同義詞補充;
[0043](4)建立本體庫框架;對于步驟(3)中整理的領(lǐng)域中大量的概念,要按照一定的邏輯規(guī)則把它們進行分組,形成不同的小專業(yè)領(lǐng)域,在同一小工作領(lǐng)域的概念,其相關(guān)性應(yīng)該比較強;另外,對其中的每一個概念的重要性要進行評估,選出關(guān)鍵性術(shù)語,摒棄那些不必要或者超出領(lǐng)域范圍的概念,盡可能準(zhǔn)確而精簡的表達出領(lǐng)域的知識;
[0044](5)本體庫自定義集成;在創(chuàng)建本體庫可以自定義,也可以是領(lǐng)域中現(xiàn)存的本體庫的重用;重用本體庫時,需要注意查看元本體庫,選擇和自己概念模型中的語義和實現(xiàn)一致的術(shù)語定義;其中涉及的關(guān)鍵技術(shù)是本體的映射;針對每個集成的本體庫,應(yīng)確定其元本體庫、術(shù)語集、形式化的本體庫描述、以及集成在自己本體庫中的位置等屬性;
[0045](6)確定概念邏輯關(guān)系;主要以專業(yè)知識的與科學(xué)分類為基礎(chǔ),根據(jù)分類學(xué)中的主題法和分類法,確定概念的邏輯關(guān)系;
[0046](7)建立完整的本體庫;將天然氣與管道標(biāo)準(zhǔn)本體庫與標(biāo)準(zhǔn)文獻有效檢索點結(jié)合,從而形成一個領(lǐng)域知識的框架體系,得到領(lǐng)域本體庫的框架結(jié)構(gòu);
[0047]建立天然氣與管道本體庫時,本體劃分應(yīng)遵循以下基本規(guī)則:a)各子項的外延之和應(yīng)等于母項的外延;b)劃分的各子項,其外延宜相互排斥;c)每次劃分應(yīng)按同一原則進行;d)劃分應(yīng)按層次逐級、由高到低、由簡到繁進行,宜結(jié)合天然氣與管道主營業(yè)務(wù)粗細結(jié)合;e)應(yīng)持續(xù)更新補充;
[0048]類目的劃分與設(shè)置應(yīng)突出主營業(yè)務(wù),將內(nèi)容相關(guān)性較大的類目,應(yīng)盡量臨近設(shè)置;對于一些無專屬的類,且具有普遍指導(dǎo)意義的綜合性基礎(chǔ)標(biāo)準(zhǔn)可根據(jù)內(nèi)容分別單獨設(shè)置類;上一層次類目的技術(shù)要求下層類目都要滿足;
[0049](8)確認與評價:本體庫應(yīng)具有正確性、一致性、可擴展性和有效性;
[0050](9)進化:在使用過程中需要對本體庫不斷更新,本體庫進化的方式可以是集成新的本體庫或定義新的概念和關(guān)系;
[0051](10)完成本體庫建立。
[0052]所述天然氣與管道標(biāo)準(zhǔn)體例庫建立步驟如圖3所示,為:
[0053]( I)標(biāo)準(zhǔn)專業(yè)分類;
[0054](2)分析每類標(biāo)準(zhǔn)體例特征,并參與進化;
[0055](3)提煉體例元素;提煉體例元素時,補充同義詞;
[0056](4)建立體例結(jié)構(gòu)表;同時補充同義詞;
[0057](5)進化,進化后重新參與分析每類標(biāo)準(zhǔn)體例特征分析;
[0058]( 6 )體例庫建立完成。
[0059]所述天然氣與管道標(biāo)準(zhǔn)體例庫建立具體方法為:
[0060]( I)對現(xiàn)有天然氣與管道標(biāo)準(zhǔn)按照專業(yè)主題范疇分布進行標(biāo)準(zhǔn)專業(yè)分類;
[0061](2)分析每類標(biāo)準(zhǔn)體例特征:分析同一主題范疇標(biāo)準(zhǔn)的體例特征,根據(jù)專業(yè)特點以及體例的結(jié)構(gòu)相似度大小判斷是否需要將同一主題范疇的標(biāo)準(zhǔn)繼續(xù)細分為不同類;
[0062](3)提煉體例元素:分析同一類中所有標(biāo)準(zhǔn)的體例特征,提煉出每項標(biāo)準(zhǔn)的體例元素,歸并此類中不同標(biāo)準(zhǔn)的相似體例元素,每個體例元素的名稱要具有概括性和通用性;
[0063](4)建立體例結(jié)構(gòu)表:對于有同義詞的體例元素,應(yīng)補充每一項體例元素據(jù)的同義詞,增加用戶的檢索入口 ;對于沒有同義詞的,可直接建立體例結(jié)構(gòu)表;
[0064]體例建立的原則為:每一類標(biāo)準(zhǔn)的一級體例元素要涵蓋此類標(biāo)準(zhǔn)的所有內(nèi)容,要保證標(biāo)準(zhǔn)知識的完整性;二級、三級以及其他級體例元素要具有共同性,即對于含有相同一級體例元素的標(biāo)準(zhǔn),應(yīng)該均能提煉出此一級體例元素下的二級、三級以及其他級體例元素;
[0065](6)進化:對不嫩滿足要求的體力元素重新進行體例特征分析、提煉體例元素、補充同義詞、建立體例結(jié)構(gòu)表;
[0066](7)完成體例庫的建立。
[0067]所述天然氣與管道內(nèi)容題錄數(shù)據(jù)庫建立包含以下步驟:
[0068]( I)確定標(biāo)準(zhǔn)文獻主題;
[0069]( 2 )判別標(biāo)準(zhǔn)文獻歸屬的體例;
[0070]( 3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析;
[0071](4)劃分標(biāo)準(zhǔn)內(nèi)容為獨立條目;
[0072](5)條目數(shù)據(jù)的分析和加工;
[0073]( 6 )初步完成數(shù)據(jù)庫建立;
[0074](7)條目格式與內(nèi)容校對修改;
[0075]( 8 )完成題錄數(shù)據(jù)庫建立。
[0076]所述天然氣與管道內(nèi)容題錄數(shù)據(jù)庫建立具體過程如圖4所示,為:
[0077](I)確定標(biāo)準(zhǔn)文獻主題:有單主體和多主題之分;若是多主題標(biāo)準(zhǔn),可以拆分成多個單主題處理;
[0078](2)判別標(biāo)準(zhǔn)文獻歸屬體例;
[0079](3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析,使該體例下的所有標(biāo)準(zhǔn)均可以和該體例完全匹配;
[0080](4)劃分標(biāo)準(zhǔn)條目:將標(biāo)準(zhǔn)內(nèi)容劃分成多個獨立條目,使得每一個條目成為一個檢孛占.[0081](5)條目數(shù)據(jù)的加工:對于標(biāo)準(zhǔn)中的每一個條目均要進行主體對象、技術(shù)指標(biāo)、提取與展示類、計量單位、內(nèi)容注釋與引用的細致分析;
[0082]主題對象:提煉條目的主題對象為一級指標(biāo);當(dāng)條目無主題對象時,則以整個標(biāo)準(zhǔn)的主題對象作為一級指標(biāo);并對主題對象的同義詞以及注釋進行補充;
[0083]技術(shù)指標(biāo):將條目中所描述的主題對象屬性,作為二級指標(biāo);并對技術(shù)指標(biāo)的同義詞以及注釋進行補充;
[0084]提取與展示類:當(dāng)條目中技術(shù)指標(biāo)是按照特定類別進行細分而形成的細化類別,將細化的類別填入提取與展示指標(biāo)類項目中;
[0085]計量單位:對于數(shù)據(jù)庫不能識別的單位,用語言進行描述;
[0086]內(nèi)容注釋:
[0087]引用條目:
[0088](6)條目格式的校準(zhǔn):完成條目加工的標(biāo)準(zhǔn),進行格式、內(nèi)容的校對;
[0089](7)完成題錄數(shù)據(jù)庫的建立。
[0090]通過以上步驟,即可完成天然氣管道標(biāo)準(zhǔn)提取與展示數(shù)據(jù)加工錄入。
[0091]本發(fā)明的有益效果:
[0092]標(biāo)準(zhǔn)內(nèi)容提取與展示技術(shù)主要克服了傳統(tǒng)檢索方式的缺點,實現(xiàn)了以下三種功倉泛:
[0093](I)能夠?qū)崿F(xiàn)對標(biāo)準(zhǔn)內(nèi)容中技術(shù)指標(biāo)的精確定位與檢索;
[0094]在檢索結(jié)果中直接顯示所要的標(biāo)準(zhǔn)檢索內(nèi)容,而不需要用戶對文獻通篇閱讀,查找需要信息,從而提高了檢索效率;
[0095](2)技術(shù)指標(biāo)相關(guān)的標(biāo)準(zhǔn)體檢索;
[0096]在檢索標(biāo)準(zhǔn)時,可以通過上位登錄,在檢索到特定標(biāo)準(zhǔn)技術(shù)指標(biāo)時,也可以檢索到其他相關(guān)標(biāo)準(zhǔn);
[0097](3)不同標(biāo)準(zhǔn)中同一技術(shù)指標(biāo)的對比。
[0098]在檢索中,通過對“范疇”等的選擇,可以實現(xiàn)同一技術(shù)指標(biāo)在不同標(biāo)準(zhǔn)的差異對比,從而了解不同標(biāo)準(zhǔn)對同一技術(shù)指標(biāo)的規(guī)定。
[0099]本發(fā)明建立的系統(tǒng)能夠?qū)崿F(xiàn)從“基本字段信息”到“重要技術(shù)指標(biāo)”的高效的標(biāo)準(zhǔn)
信息檢索。
【專利附圖】

【附圖說明】
[0100]圖1天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)建立流程圖
[0101]圖2本體庫構(gòu)建流程圖
[0102]圖3體例庫構(gòu)建流程圖
[0103]圖4天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫構(gòu)建流程圖【具體實施方式】
[0104]實施例.以本例來說明本發(fā)明的【具體實施方式】并對本發(fā)明作進一步的說明。本例是一實驗樣機,其構(gòu)成如圖所示。
[0105]本例主要包括以下步驟:
[0106]使用OCR工具對天然氣與管道標(biāo)準(zhǔn)文獻全文進行數(shù)字化加工,使標(biāo)準(zhǔn)文獻可編輯,滿足提取與展示需求;
[0107]建立油氣管道標(biāo)準(zhǔn)本體庫;
[0108]進行標(biāo)準(zhǔn)結(jié)構(gòu)分析,建立油氣管道數(shù)據(jù)體例庫;
[0109]建立天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫;
[0110]開發(fā)天然氣與管道標(biāo)準(zhǔn)提取與展示軟件系統(tǒng)平臺;
[0111]完成標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)開發(fā)。
[0112]本例的體系表如下表:
[0113]表1本體表 樣例
[0114]
[0115]
【權(quán)利要求】
1.一種天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法,其特征是它主要包括以下步驟: (1)使用光學(xué)字符識別(OCR)工具對天然氣與管道標(biāo)準(zhǔn)文獻全文進行數(shù)字化加工,使標(biāo)準(zhǔn)文獻數(shù)字化; (2)建立天然氣與管道標(biāo)準(zhǔn)本體庫、體例庫、題錄數(shù)據(jù)庫; (3)建立天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫; (4)開發(fā)天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)平臺,用于標(biāo)準(zhǔn)內(nèi)容提取、展示與對比。
2.根據(jù)權(quán)利要求1所述的天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法,其特征是具體建立步驟為: (1)按照標(biāo)準(zhǔn)文獻數(shù)字化規(guī)范,對確定的天然氣與管道標(biāo)準(zhǔn)進行全文數(shù)字化后,同時包括對文獻內(nèi)容識別與質(zhì)量審校,使標(biāo)準(zhǔn)可編輯,滿足提取與展示需求; (2)建立天然氣與管道標(biāo)準(zhǔn)本體庫、天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫、天然氣與管道標(biāo)準(zhǔn)體例庫,這三個數(shù)據(jù)庫的建立為并列過程,互不干擾; ①建立天然氣與管道標(biāo)準(zhǔn)本體庫:對天然氣與管道標(biāo)準(zhǔn)主題概念進行分析歸納,針對主體類別的概念內(nèi)涵,根據(jù)對專業(yè)知識的查詢結(jié)果和標(biāo)準(zhǔn)文獻中枚舉的標(biāo)準(zhǔn)化對象之間的從屬關(guān)系進行本體概念分析,明確標(biāo)準(zhǔn)中發(fā)生的概念體系及其層次關(guān)系,建立天然氣與管道標(biāo)準(zhǔn)本體庫; ②建立天然氣與管道體例庫:對天然氣與管道標(biāo)準(zhǔn)文獻進行分類,歸納標(biāo)準(zhǔn)的結(jié)構(gòu)化信息;按照相同結(jié)構(gòu)的標(biāo)準(zhǔn)文獻開展標(biāo)準(zhǔn)文獻體例分析,抽象出其中的核心概念及其特征描述術(shù)語,建立體例庫; ③天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫:針對天然氣與管道技術(shù)標(biāo)準(zhǔn)進行標(biāo)準(zhǔn)技術(shù)指標(biāo)分析歸納、對技術(shù)指標(biāo)體系進行術(shù)語學(xué)與概念關(guān)系研究,進行技術(shù)指標(biāo)概念的規(guī)范化及體系構(gòu)建與標(biāo)引,進行標(biāo)準(zhǔn)文獻技術(shù)指標(biāo)標(biāo)弓I,進行體例元素的分類與標(biāo)示,建立標(biāo)準(zhǔn)技術(shù)指標(biāo)數(shù)據(jù)庫,建立量與單位等輔助數(shù)據(jù)庫;以標(biāo)準(zhǔn)文本中的中文標(biāo)準(zhǔn)名稱、英文標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)號、標(biāo)準(zhǔn)類型、【技術(shù)領(lǐng)域】技術(shù)方向、采用關(guān)系、代替關(guān)系、被代替關(guān)系、引用文獻、標(biāo)準(zhǔn)狀態(tài)、立項日期、發(fā)布日期、實施日期、確認日期、重要程度分級、歸口單位、起草單位、摘要、中文主題詞、英文主題詞、譯文、備注、正文等信息為基礎(chǔ),建立標(biāo)準(zhǔn)題錄數(shù)據(jù)庫; (3)建立天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫 原有的標(biāo)準(zhǔn)體系表同步驟(2)所建立本體庫、題錄數(shù)據(jù)庫、體例庫三個數(shù)據(jù)庫,形成天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫; (4)開發(fā)天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)平臺,該系統(tǒng)除一般檢索系統(tǒng)功能外,如基本檢索功能、管理功能、在線反饋功能、幫助功能等功能,而且還應(yīng)具有標(biāo)準(zhǔn)內(nèi)容指標(biāo)檢索功能、標(biāo)準(zhǔn)指標(biāo)加工功能。
【文檔編號】G06F17/30GK103699540SQ201210366594
【公開日】2014年4月2日 申請日期:2012年9月28日 優(yōu)先權(quán)日:2012年9月28日
【發(fā)明者】劉冰, 張欣, 姚學(xué)軍, 稅碧垣, 劉艷雙, 鄭娟, 李云杰 申請人:中國石油天然氣股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1