天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的構(gòu)建方法
【專利摘要】本發(fā)明是一種天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的建立方法,涉及數(shù)字?jǐn)?shù)據(jù)處理裝置和管道系統(tǒng)【技術(shù)領(lǐng)域】。它包含以下步驟:(1)確定標(biāo)準(zhǔn)文獻(xiàn)主題;(2)判別標(biāo)準(zhǔn)文獻(xiàn)歸屬的體例;(3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析;(4)劃分標(biāo)準(zhǔn)內(nèi)容為獨立條目;(5)條目數(shù)據(jù)的分析和加工;(6)初步完成數(shù)據(jù)庫建立;(7)條目格式與內(nèi)容校對修改;(8)完成題錄數(shù)據(jù)庫建立。本發(fā)明所建立的系統(tǒng)能夠?qū)崿F(xiàn)從“基本字段信息”到“重要技術(shù)指標(biāo)”的高效的標(biāo)準(zhǔn)信息檢索。
【專利說明】天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是一種天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的構(gòu)建方法,涉及數(shù)字?jǐn)?shù)據(jù)處理裝置和管道系統(tǒng)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]隨著信息技術(shù)與網(wǎng)絡(luò)技術(shù)的發(fā)展,信息共享系統(tǒng)已經(jīng)在各個行業(yè)廣泛應(yīng)用,大大提高了各行業(yè)工作勞動效率與便捷性,天然氣與管道行業(yè)在信息化技術(shù)應(yīng)用方面一直走在行業(yè)前列,隨著業(yè)務(wù)、技術(shù)的進(jìn)一步發(fā)展,僅僅提供文獻(xiàn)級別的檢索、瀏覽等功能已經(jīng)不能滿足用戶的需求,必須進(jìn)行更深一步的挖掘與服務(wù),以滿足用戶需求。目前常用的標(biāo)準(zhǔn)檢索方式為“基本字段信息”檢索,一般僅能提供對標(biāo)準(zhǔn)名稱、主題詞進(jìn)行檢索,不能實現(xiàn)對技術(shù)指標(biāo)的精確定位與檢索、不同標(biāo)準(zhǔn)中同一技術(shù)指標(biāo)的對比。概括起來,傳統(tǒng)檢索方式對技術(shù)標(biāo)準(zhǔn)的使用效果有以下幾方面的局限性。
[0003](I)不能對技術(shù)標(biāo)準(zhǔn)內(nèi)容進(jìn)行精確檢索
[0004]傳統(tǒng)數(shù)據(jù)庫檢索方式是通過分類、標(biāo)題、摘要及敘詞等手段對標(biāo)準(zhǔn)文獻(xiàn)進(jìn)行題錄數(shù)據(jù)加工,來實現(xiàn)對技術(shù)標(biāo)準(zhǔn)與技術(shù)法規(guī)的檢索。但是技術(shù)指標(biāo)一般會分散在不同技術(shù)標(biāo)準(zhǔn)與技術(shù)法規(guī)中,傳統(tǒng)的檢索方式只能通過題錄數(shù)據(jù)庫檢索到相關(guān)標(biāo)準(zhǔn),逐一閱讀原文技術(shù)指標(biāo)的內(nèi)容。但是這樣的方法很浪費時間,并且難以保障查全率。
[0005](2)不能同時檢索到不同標(biāo)準(zhǔn)的技術(shù)指標(biāo),并實現(xiàn)不同標(biāo)準(zhǔn)的同一技術(shù)指標(biāo)的對比。
[0006]在檢索過程中,經(jīng)常會出現(xiàn)同一產(chǎn)品的技術(shù)指標(biāo)同時存在國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)等不同的標(biāo)準(zhǔn)中,用戶經(jīng)常需要對不同標(biāo)準(zhǔn)中的相同產(chǎn)品的技術(shù)指標(biāo)進(jìn)行對比研究,這是傳統(tǒng)檢索方式所不能滿足的。
[0007]標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)是標(biāo)準(zhǔn)信息檢索的最新發(fā)展方向。這種新型的檢索方式通過對標(biāo)準(zhǔn)技術(shù)指標(biāo)的系統(tǒng)提取和有效組織,能夠?qū)崿F(xiàn)從“基本字段信息”到“重要技術(shù)指標(biāo)”的高效的標(biāo)準(zhǔn)信息檢索。對于負(fù)責(zé)油氣管道工程建設(shè)的工程項目管理人員、實施人員,可以實現(xiàn)利用關(guān)鍵指標(biāo)控制管道設(shè)計和施工建設(shè);對于油氣管道運行操作人員、管理人員,可以實現(xiàn)查詢、對比操作參數(shù)、方法;對于科研人員,可以實現(xiàn)國內(nèi)外標(biāo)準(zhǔn)關(guān)鍵指標(biāo)差異分析、判斷技術(shù)差異,分析體系內(nèi)各標(biāo)準(zhǔn)間的協(xié)調(diào)性。
[0008]CN102591878A公開了一種技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法,《石油規(guī)劃設(shè)計》2011年第22卷第6期“天然氣與管道標(biāo)準(zhǔn)信息管理系統(tǒng)開發(fā)方案研究”公開了一種天然氣與管道標(biāo)準(zhǔn)信息管理系統(tǒng)的開發(fā)方案,但該系統(tǒng)僅能進(jìn)行標(biāo)準(zhǔn)全文檢索,無法實現(xiàn)標(biāo)準(zhǔn)內(nèi)容的提取與展示,也并未公開建立天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的方法,其技術(shù)并不完善。
[0009]標(biāo)準(zhǔn)內(nèi)容提取與展示技術(shù)是一種新的標(biāo)準(zhǔn)檢索技術(shù),目前國外未見以此技術(shù)開發(fā)的商業(yè)數(shù)據(jù)庫。在國內(nèi),只有中國標(biāo)準(zhǔn)化研究院將標(biāo)準(zhǔn)內(nèi)容提取與展示技術(shù)初步應(yīng)用在食品、農(nóng)產(chǎn)品的國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)中,并建設(shè)了相應(yīng)的提取與展示系統(tǒng)平臺,實現(xiàn)對標(biāo)準(zhǔn)內(nèi)容指標(biāo)的提取與展示。目前國內(nèi)外尚沒有天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法。
[0010]傳統(tǒng)的檢索系統(tǒng)數(shù)據(jù)加工錄入方式一般僅僅是對標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)號、主題詞、等基本字段信息及標(biāo)準(zhǔn)全文等進(jìn)行加工錄入。這種傳統(tǒng)的數(shù)據(jù)加工錄入無法滿足天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)數(shù)據(jù)加工錄入要求。要實現(xiàn)標(biāo)準(zhǔn)內(nèi)容和指標(biāo)等的深層次提取和展示,必須對本體、體例、指標(biāo)等數(shù)據(jù)進(jìn)行有效組織,形成內(nèi)在有機(jī)聯(lián)系的系統(tǒng)和統(tǒng)一的檢索規(guī)則。因此必須研究新的數(shù)據(jù)組織形式和加工錄入方式。
【發(fā)明內(nèi)容】
[0011]本發(fā)明的目的是發(fā)明一種能夠本體、體例、指標(biāo)深層分解的檢索數(shù)據(jù)進(jìn)行有效組織、形成內(nèi)在有機(jī)聯(lián)系的系統(tǒng)和統(tǒng)一的檢索規(guī)則、完成標(biāo)準(zhǔn)內(nèi)容提取與展示數(shù)據(jù)的錄入、實現(xiàn)標(biāo)準(zhǔn)內(nèi)容的深層檢索的天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的構(gòu)建方法。
[0012]本發(fā)明是天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)中題錄數(shù)據(jù)庫的建立方法,天然氣與管道技術(shù)標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)的建立方法如圖1所示,主要包括以下步驟:
[0013](I)使用光學(xué)字符識別(OCR)工具對天然氣與管道標(biāo)準(zhǔn)文獻(xiàn)全文進(jìn)行數(shù)字化加工,使標(biāo)準(zhǔn)文獻(xiàn)數(shù)字化;
[0014](2)建立天然氣與管道標(biāo)準(zhǔn)本體庫、體例庫、題錄數(shù)據(jù)庫;
[0015](3)建立天然氣與管道標(biāo)準(zhǔn)內(nèi)容數(shù)據(jù)庫;
[0016](4)開發(fā)天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)平臺,用于標(biāo)準(zhǔn)內(nèi)容提取、展示與對比。
[0017]天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫建立包含以下步驟:
[0018](I)確定標(biāo)準(zhǔn)文獻(xiàn)主題;
[0019](2)判別標(biāo)準(zhǔn)文獻(xiàn)歸屬的體例;
[0020]( 3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析;
[0021](4)劃分標(biāo)準(zhǔn)內(nèi)容為獨立條目;
[0022](5)條目數(shù)據(jù)的分析和加工;
[0023]( 6 )初步完成數(shù)據(jù)庫建立;
[0024](7)條目格式與內(nèi)容校對修改;
[0025]( 8 )完成題錄數(shù)據(jù)庫建立。
[0026]所述天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫建立具體過程為:
[0027](I)確定標(biāo)準(zhǔn)文獻(xiàn)主題:有單主體和多主題之分;若是多主題標(biāo)準(zhǔn),可以拆分成多個單主題處理;
[0028]( 2 )判別標(biāo)準(zhǔn)文獻(xiàn)歸屬體例;
[0029](3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析,使該體例下的所有標(biāo)準(zhǔn)均可以和該體例完全匹配;
[0030](4)劃分標(biāo)準(zhǔn)條目:將標(biāo)準(zhǔn)內(nèi)容劃分成多個獨立條目,使得每一個條目成為一個檢孛占.[0031](5)條目數(shù)據(jù)的加工:對于標(biāo)準(zhǔn)中的每一個條目均要進(jìn)行主體對象、技術(shù)指標(biāo)、提取與展示類、計量單位、內(nèi)容注釋與引用的細(xì)致分析;
[0032]主題對象:提煉條目的主題對象為一級指標(biāo);當(dāng)條目無主題對象時,則以整個標(biāo)準(zhǔn)的主題對象作為一級指標(biāo);并對主題對象的同義詞以及注釋進(jìn)行補(bǔ)充;
[0033]技術(shù)指標(biāo):將條目中所描述的王題對象屬性,作為二級指標(biāo);并對技術(shù)指標(biāo)的冋義詞以及注釋進(jìn)行補(bǔ)充;
[0034]提取與展示類:當(dāng)條目中技術(shù)指標(biāo)是按照特定類別進(jìn)行細(xì)分而形成的細(xì)化類別,將細(xì)化的類別填入提取與展示指標(biāo)類項目中;
[0035]計量單位:對于數(shù)據(jù)庫不能識別的單位,用語言進(jìn)行描述;
[0036]內(nèi)容注釋:
[0037]引用條目:
[0038](6)條目格式的校準(zhǔn):完成條目加工的標(biāo)準(zhǔn),進(jìn)行格式、內(nèi)容的校對;
[0039](7)完成題錄數(shù)據(jù)庫的建立。
[0040]本發(fā)明的有益效果:
[0041]本發(fā)明為天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的構(gòu)建方法,通過該方法能夠?qū)⒈倔w、體例、指標(biāo)等深層分解的檢索數(shù)據(jù)進(jìn)行有效組織,形成內(nèi)在有機(jī)聯(lián)系的系統(tǒng)和統(tǒng)一的檢索規(guī)貝U,完成標(biāo)準(zhǔn)內(nèi)容提取與展示數(shù)據(jù)的錄入,最終實現(xiàn)標(biāo)準(zhǔn)內(nèi)容的提取與展示等深層檢索功倉泛。
【專利附圖】
【附圖說明】
[0042]圖1天然氣與管道標(biāo)準(zhǔn)內(nèi)容提取與展示系統(tǒng)建立流程圖
[0043]圖2天然氣與管道標(biāo)準(zhǔn)題錄數(shù)據(jù)庫構(gòu)建流程圖
【具體實施方式】
[0044]實施例.以本例來說明本發(fā)明的【具體實施方式】并對本發(fā)明作進(jìn)一步的說明。本例是一實驗方法,其構(gòu)成如圖2所示。
[0045]本例主要包括以下步驟:
[0046](I)確定標(biāo)準(zhǔn)文獻(xiàn)主題:有單主體和多主題之分;若是多主題標(biāo)準(zhǔn),可以拆分成多個單主題處理;
[0047]( 2 )判別標(biāo)準(zhǔn)文獻(xiàn)歸屬體例;
[0048](3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析,使該體例下的所有標(biāo)準(zhǔn)均可以和該體例完全匹配;
[0049](4)劃分標(biāo)準(zhǔn)條目:將標(biāo)準(zhǔn)內(nèi)容劃分成多個獨立條目,使得每一個條目成為一個檢孛占.[0050](5)條目數(shù)據(jù)的加工:對于標(biāo)準(zhǔn)中的每一個條目均要進(jìn)行主體對象、技術(shù)指標(biāo)、提取與展示類、計量單位、內(nèi)容注釋與引用的細(xì)致分析;
[0051]主題對象:提煉條目的主題對象為一級指標(biāo);當(dāng)條目無主題對象時,則以整個標(biāo)準(zhǔn)的主題對象作為一級指標(biāo);并對主題對象的同義詞以及注釋進(jìn)行補(bǔ)充;
[0052]技術(shù)指標(biāo):將條目中所描述的主題對象屬性,作為二級指標(biāo);并對技術(shù)指標(biāo)的同義詞以及注釋進(jìn) 行補(bǔ)充;
[0053]提取與展示類:當(dāng)條目中技術(shù)指標(biāo)是按照特定類別進(jìn)行細(xì)分而形成的細(xì)化類別,將細(xì)化的類別填入提取與展示指標(biāo)類項目中;
[0054]計量單位:對于數(shù)據(jù)庫不能識別的單位,用語言進(jìn)行描述;[0055]內(nèi)容注釋:
[0056]引用條目:
[0057](6)條目格式的校準(zhǔn):完成條目加工的標(biāo)準(zhǔn),進(jìn)行格式、內(nèi)容的校對;
[0058](7)完成題錄數(shù)據(jù)庫的建立。
[0059]本例經(jīng)試用,本方法能夠?qū)⒈倔w、體例、指標(biāo)等深層分解的檢索數(shù)據(jù)進(jìn)行有效組織,形成內(nèi)在有機(jī)聯(lián)系的系統(tǒng)和統(tǒng)一的檢索規(guī)則,完成標(biāo)準(zhǔn)內(nèi)容提取與展示數(shù)據(jù)的錄入,最終實現(xiàn)標(biāo)準(zhǔn)內(nèi)容的提取與展示等深層檢索功能。
【權(quán)利要求】
1.一種天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的建立方法,其特征是它包含以下步驟: (1)確定標(biāo)準(zhǔn)文獻(xiàn)主題; (2)判別標(biāo)準(zhǔn)文獻(xiàn)歸屬的體例; (3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析; (4)劃分標(biāo)準(zhǔn)內(nèi)容為獨立條目; (5)條目數(shù)據(jù)的分析和加工; (6)初步完成數(shù)據(jù)庫建立; (7 )條目格式與內(nèi)容校對修改; (8)完成題錄數(shù)據(jù)庫建立。
2.根據(jù)權(quán)利要求1所述的天然氣與管道技術(shù)標(biāo)準(zhǔn)題錄數(shù)據(jù)庫的建立方法,其特征是題錄數(shù)據(jù)庫建立具體過程為: (I)確定標(biāo)準(zhǔn)文獻(xiàn)主題:有單主體和多主題之分;若是多主題標(biāo)準(zhǔn),可以拆分成多個單主題處理; (2 )判別標(biāo)準(zhǔn)文獻(xiàn)歸屬體例; (3)標(biāo)準(zhǔn)體例結(jié)構(gòu)分析,使該體例下的所有標(biāo)準(zhǔn)均可以和該體例完全匹配; (4)劃分標(biāo)準(zhǔn)條目:將標(biāo)準(zhǔn)內(nèi)容劃分成多個獨立條目,使得每一個條目成為一個檢索占.(5)條目數(shù)據(jù)的加工:對于標(biāo)準(zhǔn)中的每一個條目均要進(jìn)行主體對象、技術(shù)指標(biāo)、揭示類、計量單位、內(nèi)容注釋與引用的細(xì)致分析; 主題對象:提煉條目的主題對象為一級指標(biāo);當(dāng)條目無主題對象時,則以整個標(biāo)準(zhǔn)的主題對象作為一級指標(biāo);并對主題對象的同義詞以及注釋進(jìn)行補(bǔ)充; 技術(shù)指標(biāo):將條目中所描述的主題對象屬性,作為二級指標(biāo);并對技術(shù)指標(biāo)的同義詞以及注釋進(jìn)行補(bǔ)充; 揭示類:當(dāng)條目中技術(shù)指標(biāo)是按照特定類別進(jìn)行細(xì)分而形成的細(xì)化類別,將細(xì)化的類別填入揭示指標(biāo)類項目中; 計量單位:對于數(shù)據(jù)庫不能識別的單位,用語言進(jìn)行描述; 內(nèi)容注釋: 引用條目: (6)條目格式的校準(zhǔn):完成條目加工的標(biāo)準(zhǔn),進(jìn)行格式、內(nèi)容的校對; (7)完成題錄數(shù)據(jù)庫的建立。
【文檔編號】G06F17/30GK103699537SQ201210366325
【公開日】2014年4月2日 申請日期:2012年9月28日 優(yōu)先權(quán)日:2012年9月28日
【發(fā)明者】劉冰, 吳凱旋, 趙晉云, 馬偉平, 王禹欽, 姚學(xué)軍, 稅碧垣, 劉艷雙 申請人:中國石油天然氣股份有限公司