最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法及系統(tǒng)與流程

文檔序號:11920990閱讀:580來源:國知局
一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法及系統(tǒng)與流程

本發(fā)明屬于概率圖模型技術(shù)領(lǐng)域,涉及概率圖模型之間的轉(zhuǎn)換技術(shù),尤其是一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法及系統(tǒng)。



背景技術(shù):

概率(probability)在機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等智能分析推理技術(shù)領(lǐng)域起著核心作用。傳統(tǒng)的概率論(probability theory)可以用和規(guī)則(the sum rule)、積規(guī)則(the product rule)方程式來表示,所有概率推理和學(xué)習(xí)的代數(shù)操作(algebraic manipulations)都等同于反復(fù)應(yīng)用這兩個簡單方程式。然而,借助概率圖模型(probabilistic graphical model),可將概率模型的底層代數(shù)表示(algebraic representations)等價變換成為直觀的圖形表示(graphical representations),這樣,概率推理和學(xué)習(xí)的復(fù)雜代數(shù)操作就可借助更為直觀、方便的圖操縱(graphical manipulations)來實(shí)現(xiàn)。

關(guān)于概率圖模型技術(shù),可參閱全球最權(quán)威的學(xué)術(shù)專著:Daphne Koller and Nir Friedman.Probabilistic Graphical Models:Principles and Techniques.The MIT Press,2009.ISBN 978-0-262-01319-2(下文簡稱為《Probabilistic Graphical Models:Principles and Techniques》),該專著的中譯版為:作者:[美]Daphne Koller,[以色列]Nir Friedman;譯者:王飛躍,韓素青.概率圖模型:原理與技術(shù).清華大學(xué)出版社,2015.ISBN:978-7-302-37134-2(下文簡稱為《概率圖模型:原理與技術(shù)》)。

概率圖模型是概率論(probability theory)與圖論(graph theory)相結(jié)合的產(chǎn)物,通過圖模型來表示概率分布(probability distributions),尤其是表示隨機(jī)變量之間的條件依賴(conditional dependence)關(guān)系與結(jié)構(gòu)。一個概率圖模型通過連接線(links)——也稱邊(edges)或弧(arcs),來連接一對節(jié)點(diǎn)(nodes)——也稱頂點(diǎn)(vertices);每個節(jié)點(diǎn)表示一個隨機(jī)變量(random variables)(或隨機(jī)變量組),通過連接線來表示隨機(jī)變量之間的概率關(guān)系。于是,概率圖模型表示了代數(shù)上的一種因子分解(factorization)關(guān)系,即:定義在一個隨機(jī)變量集上的聯(lián)合分布可被分解成各自僅依賴于一個變量子集的函數(shù)(即因子)的乘積。

常用的概率圖模型包括有向圖模型(directed graphical models)和無向圖模型(undirected graphical models)。

有向圖模型常稱為貝葉斯網(wǎng)絡(luò)(Bayesian network)(參見:《Probabilistic Graphical Models:Principles and Techniques》,Section 3.2 Bayesian Networks,pages 51–68中的Definition 3.5,page 62;或者:《概率圖模型:原理與技術(shù)》,3.2貝葉斯網(wǎng),pages 51–68,定義3.5,page 61),適用于表示隨機(jī)變量之間的因果關(guān)系(causal relationships)。

無向圖模型常稱為馬爾可夫隨機(jī)場(Markov random field,MRF)或馬爾可夫網(wǎng)絡(luò)(Markov network)(參見:《Probabilistic Graphical Models:Principles and Techniques》,Section 4.2.2Gibbs Distributions and Markov Networks,pages 108–110中的Definition 4.3,page 108和Definition 4.4,page 109;或者:《概率圖模型:原理與技術(shù)》,4.2.2吉布斯分布與馬爾可夫網(wǎng),pages 107–109中的定義4.3,page 107和定義4.4,page 108),適用于表示隨機(jī)變量之間的軟約束(soft constraints)。馬爾可夫網(wǎng)絡(luò)是一個無向圖,其中,每個節(jié)點(diǎn)表示一個隨機(jī)變量,每條無向邊連接一對隨機(jī)變量節(jié)點(diǎn),圖中表示了若干個稱為最大團(tuán)(maximal clique)的最大完全子圖(maximal complete subgraph),所謂最大完全子圖就是該子圖中的所有節(jié)點(diǎn)對均通過一條無向邊進(jìn)行連接,且該子圖中再增加圖中任何節(jié)點(diǎn)將不具有這種性質(zhì),在每個最大團(tuán)中所有節(jié)點(diǎn)所對應(yīng)的若干個隨機(jī)變量上定義了一個稱為最大團(tuán)勢(maximal clique potential)的函數(shù),且這些最大團(tuán)勢函數(shù)均是非負(fù)函數(shù),于是,馬爾可夫網(wǎng)絡(luò)在代數(shù)上表示了這樣一種因子分解(factorization)關(guān)系:定義在所有隨機(jī)變量上的聯(lián)合分布可表示為所有最大團(tuán)勢函數(shù)(即因子)的乘積再乘以一個歸一化因子(normalization factor),該歸一化因子是一個歸一化系數(shù)(normalization coefficient),可看成是一個定義在隨機(jī)變量空集上的常值函數(shù)(constant function),它是稱為配分函數(shù)(partition function)的歸一化常數(shù)(normalization constant)的倒數(shù)。

因子圖(factor graph)是一種新穎的無向圖模型(參見:《Probabilistic Graphical Models:Principles and Techniques》,Section 4.4.1.1 Factor Graphs,pages 123–124,Definition 4.13,page 123;或者:《概率圖模型:原理與技術(shù)》,4.4.1.1因子圖,pages 121–122,定義4.13,page122)。因子圖是由變量節(jié)點(diǎn)與因子(factor)節(jié)點(diǎn)所構(gòu)成的一個二分圖(bipartite graph),因子或因子節(jié)點(diǎn)也稱為局部函數(shù)(local function),在因子圖中,每個變量節(jié)點(diǎn)表示變量集中的一個變量,每個因子節(jié)點(diǎn)表示定義在變量子集上的一個局部函數(shù),當(dāng)且僅當(dāng)某個變量是一個局部函數(shù)的自變量(argument)時,該變量節(jié)點(diǎn)與該因子節(jié)點(diǎn)之間有一條無向邊,于是,定義在變量集上的一個全局函數(shù)(global function)可表示為所有定義在變量子集上的局部函數(shù)(即因子)的乘積;當(dāng)全局函數(shù)用于表示一組隨機(jī)變量的聯(lián)合分布時,因子圖成為一種新穎的概率圖模型。因子圖模型的突出優(yōu)勢在于概率推理的代數(shù)操作可借助因子圖上的高效率的推理算法來實(shí)現(xiàn)。

概率圖模型之間的相互轉(zhuǎn)換技術(shù)有利于復(fù)用已有的概率模型,簡化概率建模過程,從而促進(jìn)概率圖模型在機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等智能分析推理技術(shù)領(lǐng)域中的應(yīng)用。貝葉斯網(wǎng)絡(luò)、馬爾可夫網(wǎng)絡(luò)等傳統(tǒng)概率圖模型之間的相互轉(zhuǎn)換已存在相應(yīng)的方法,例如,從貝葉斯網(wǎng)絡(luò)到馬爾可夫網(wǎng)絡(luò)的轉(zhuǎn)換方法(參見:《Probabilistic Graphical Models:Principles and Techniques》,Section 4.5.1 From Bayesian Networks to Markov Networks,pages 134–137;或者:《概率圖模型:原理與技術(shù)》,4.5.1從貝葉斯網(wǎng)到馬爾可夫網(wǎng),pages 132–136),從馬爾可夫網(wǎng)絡(luò)到貝葉斯網(wǎng)絡(luò)的轉(zhuǎn)換方法(參見:《Probabilistic Graphical Models:Principles and Techniques》,Section 4.5.2 From Markov Networks to Bayesian Networks,pages 137–139;或者:《概率圖模型:原理與技術(shù)》,4.5.2從馬爾可夫網(wǎng)到貝葉斯網(wǎng),pages 136–138)。然而,傳統(tǒng)概率圖模型向因子圖這樣的新穎概率圖模型的等價轉(zhuǎn)換,目前尚缺乏相應(yīng)的方法,也缺乏完整、可實(shí)施的技術(shù)方案。本發(fā)明的目的就是提供一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法及系統(tǒng)。所謂“等價轉(zhuǎn)換”就是,雖然轉(zhuǎn)換前后的兩種概率圖模型在圖形表示上完全不同,但它們在代數(shù)上所表示的聯(lián)合分布的因子分解關(guān)系是完全等價的。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問題是提供一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法及系統(tǒng),從而克服目前缺乏馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的完整、可實(shí)施技術(shù)方案的缺陷。

為解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:

根據(jù)本發(fā)明的一個方面,提供了一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法,包括下列步驟:

S1:輸入待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò);

S2:依次按轉(zhuǎn)換規(guī)則1、2和3將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖:

轉(zhuǎn)換規(guī)則1:創(chuàng)建因子圖的所有變量節(jié)點(diǎn),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)的所有隨機(jī)變量節(jié)點(diǎn);

轉(zhuǎn)換規(guī)則2:創(chuàng)建因子圖的所有因子節(jié)點(diǎn)即局部函數(shù),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)中表示的所有最大團(tuán)勢函數(shù);

轉(zhuǎn)換規(guī)則3:當(dāng)且僅當(dāng)因子圖中某個變量是一個局部函數(shù)的自變量時,添加連接該變量節(jié)點(diǎn)與該局部函數(shù)即因子節(jié)點(diǎn)的無向邊;

S3:輸出轉(zhuǎn)換成的因子圖。

在該方法中,所述步驟S1中的馬爾可夫網(wǎng)絡(luò)進(jìn)一步包括:

馬爾可夫網(wǎng)絡(luò)的圖形表示如下:作為一種概率圖模型,馬爾可夫網(wǎng)絡(luò)是一個無向圖,其中,每個節(jié)點(diǎn)對應(yīng)一個隨機(jī)變量,每條無向邊連接一對隨機(jī)變量節(jié)點(diǎn),圖中表示了若干個稱為最大團(tuán)的最大完全子圖,在每個最大團(tuán)中所有節(jié)點(diǎn)所對應(yīng)的若干個隨機(jī)變量上定義了一個稱為最大團(tuán)勢的函數(shù),且這些最大團(tuán)勢函數(shù)均是非負(fù)函數(shù),于是,馬爾可夫網(wǎng)絡(luò)在代數(shù)上表示了這樣一種因子分解關(guān)系:定義在所有隨機(jī)變量上的聯(lián)合分布可表示為所有最大團(tuán)勢函數(shù)的乘積再乘以一個歸一化因子,該歸一化因子是一個歸一化系數(shù),可看成是一個定義在隨機(jī)變量空集上的常值函數(shù),它是稱為配分函數(shù)的歸一化常數(shù)的倒數(shù);

馬爾可夫網(wǎng)絡(luò)的代數(shù)表示如下:馬爾可夫網(wǎng)絡(luò)MN(X,L)表示為一個聯(lián)合分布的因子分解關(guān)系其中,p(X)是定義在隨機(jī)變量集X={x1,...,xK}上的聯(lián)合分布,Z-1是該因子分解中的歸一化因子,配分函數(shù)是一個歸一化常數(shù),每個因子是定義在最大團(tuán)Cn中所有節(jié)點(diǎn)所對應(yīng)的隨機(jī)變量子集上的一個最大團(tuán)勢函數(shù),每個最大團(tuán)是一個最大完全子圖,其中所有節(jié)點(diǎn)對均通過一條無向邊進(jìn)行連接,所有這樣的無向邊構(gòu)成馬爾可夫網(wǎng)絡(luò)MN(X,L)的無向邊集L。

在該方法中,所述步驟S1中的因子圖進(jìn)一步包括:

因子圖的圖形表示如下:因子圖是由變量節(jié)點(diǎn)與因子節(jié)點(diǎn)所構(gòu)成的一個二分圖,其中,每個變量節(jié)點(diǎn)表示變量集中的一個變量,每個因子節(jié)點(diǎn)表示定義在變量子集上的一個局部函數(shù),當(dāng)且僅當(dāng)某個變量是一個局部函數(shù)的自變量時,該變量節(jié)點(diǎn)與該因子節(jié)點(diǎn)之間有一條無向邊,于是,定義在變量集上的一個全局函數(shù)可表示為所有定義在變量子集上的局部函數(shù)的乘積;當(dāng)全局函數(shù)用于表示一組隨機(jī)變量的聯(lián)合分布時,因子圖成為一種新穎的概率圖模型;

因子圖的代數(shù)表示如下:因子圖FG(X,F,E)表示為一個全局函數(shù)的因子分解關(guān)系其中,h(X)是定義在變量集X={x1,...,xK}上的全局函數(shù),每個局部函數(shù)fj(Xj),j∈{1,...,J}稱為定義在變量子集上的一個因子,所有這樣的局部函數(shù)構(gòu)成因子圖FG(X,F,E)的局部函數(shù)集F={f1,...,fJ},同時,因子圖FG(X,F,E)的無向邊集E={(xj,fj)|iif xj∈Xj};當(dāng)全局函數(shù)h(X)用于表示定義在隨機(jī)變量集X上的聯(lián)合分布時,因子圖FG(X,F,E)成為一個概率圖模型。

在該方法中,所述步驟S2中的轉(zhuǎn)換規(guī)則1、2和3進(jìn)一步包括:

轉(zhuǎn)換規(guī)則1的代數(shù)表示如下:將馬爾可夫網(wǎng)絡(luò)MN(X,L)中全部K個隨機(jī)變量xk∈X,k∈{1,...,K}對應(yīng)地轉(zhuǎn)換為因子圖FG(X,F,E)中的K個變量

轉(zhuǎn)換規(guī)則2的代數(shù)表示如下:將馬爾可夫網(wǎng)絡(luò)MN(X,L)中全部N個最大團(tuán)勢函數(shù)對應(yīng)地轉(zhuǎn)換為因子圖FG(X,F,E)中J=N個局部函數(shù)fj∈F,j∈{1,...,J};

轉(zhuǎn)換規(guī)則3的代數(shù)表示如下:令因子圖FG(X,F,E)中全部J=N個局部函數(shù)fj∈F,j∈{1,...,J}分別表示馬爾可夫網(wǎng)絡(luò)MN(X,L)中N個最大團(tuán)勢函數(shù),即這些因子圖局部函數(shù)它們表示了因子圖的無向邊集E={(xj,fj)|iif xj∈Xj};令該因子圖的全局函數(shù)h(X)表示定義在隨機(jī)變量集X上的聯(lián)合分布再乘以該馬爾可夫網(wǎng)絡(luò)中的歸一化常數(shù)Z,即:h(X)=p(X)×Z;于是,該因子圖所表示的因子分解關(guān)系即為它等價于J=N,該因子分解關(guān)系與馬爾可夫網(wǎng)絡(luò)MN(X,L)所表示的因子分解關(guān)系完全等價。

根據(jù)本發(fā)明的另一個方面,還提供了一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的系統(tǒng),包括:馬爾可夫網(wǎng)絡(luò)輸入模塊、馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換模塊、因子圖輸出模塊、人機(jī)交互界面,其中:

所述馬爾可夫網(wǎng)絡(luò)輸入模塊用于實(shí)現(xiàn)輸入待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò);

所述馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換模塊進(jìn)一步包括三個子模塊:因子圖的變量節(jié)點(diǎn)創(chuàng)建子模塊、因子圖的因子節(jié)點(diǎn)創(chuàng)建子模塊和因子圖的無向邊添加子模塊,它們依次分別按轉(zhuǎn)換規(guī)則1、2和3實(shí)現(xiàn)將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖;

上述轉(zhuǎn)換規(guī)則1、2和3具體為:

轉(zhuǎn)換規(guī)則1:創(chuàng)建因子圖的所有變量節(jié)點(diǎn),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)的所有隨機(jī)變量節(jié)點(diǎn);

轉(zhuǎn)換規(guī)則2:創(chuàng)建因子圖的所有因子節(jié)點(diǎn)即局部函數(shù),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)中表示的所有最大團(tuán)勢函數(shù);

轉(zhuǎn)換規(guī)則3:當(dāng)且僅當(dāng)因子圖中某個變量是一個局部函數(shù)的自變量時,添加連接該變量節(jié)點(diǎn)與該局部函數(shù)即因子節(jié)點(diǎn)的無向邊;

所述因子圖輸出模塊用于實(shí)現(xiàn)輸出轉(zhuǎn)換成的因子圖;

所述人機(jī)交互界面用于實(shí)現(xiàn)用戶與該系統(tǒng)之間的人機(jī)交互,包括:用戶通過此界面輸入并圖示一個馬爾可夫網(wǎng)絡(luò),用戶通過此界面提交馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的執(zhí)行指令,用戶通過此界面輸出并圖示一個轉(zhuǎn)換成的因子圖。

本發(fā)明的有益技術(shù)效果主要包括三個方面:(1)克服了目前缺乏馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的完整、可實(shí)施技術(shù)方案的缺陷;(2)所提供的轉(zhuǎn)換方法簡單易行、轉(zhuǎn)換系統(tǒng)易于實(shí)現(xiàn);(3)所提供的轉(zhuǎn)換方法及系統(tǒng)在概率建模與推理、機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等領(lǐng)域具有廣闊的應(yīng)用前景。

下面結(jié)合附圖對本發(fā)明的具體實(shí)施方式作進(jìn)一步的描述。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。

附圖說明

圖1是根據(jù)本發(fā)明技術(shù)方案的一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法的步驟流程圖;

圖2是根據(jù)本發(fā)明技術(shù)方案的一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的系統(tǒng)的模塊結(jié)構(gòu)與處理流程圖,圖中符號遵循國家標(biāo)準(zhǔn)GB 1526-89(等同于國際標(biāo)準(zhǔn)ISO 5807-1985);

圖3是本發(fā)明的一個優(yōu)選實(shí)施例中馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的過程與規(guī)則的示意。

具體實(shí)施方式

下面詳細(xì)描述本發(fā)明的實(shí)施方式,所述實(shí)施方式的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的概念、對象、要素等或具有相同或類似功能的概念、對象、要素等。下面通過參考附圖描述的實(shí)施方式是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。

本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(包括技術(shù)術(shù)語和科學(xué)術(shù)語)具有與本發(fā)明所屬領(lǐng)域及相關(guān)領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣定義,不會用理想化或過于正式的含義來解釋。

為了解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:

根據(jù)本發(fā)明的一個方面,提供了一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法,如圖1所示,包括下列步驟:

S1:輸入待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò),所述馬爾可夫網(wǎng)絡(luò)進(jìn)一步包括:

馬爾可夫網(wǎng)絡(luò)的圖形表示如下:作為一種概率圖模型,馬爾可夫網(wǎng)絡(luò)是一個無向圖,其中,每個節(jié)點(diǎn)對應(yīng)一個隨機(jī)變量,每條無向邊連接一對隨機(jī)變量節(jié)點(diǎn),圖中表示了若干個稱為最大團(tuán)的最大完全子圖,在每個最大團(tuán)中所有節(jié)點(diǎn)所對應(yīng)的若干個隨機(jī)變量上定義了一個稱為最大團(tuán)勢的函數(shù),且這些最大團(tuán)勢函數(shù)均是非負(fù)函數(shù),于是,馬爾可夫網(wǎng)絡(luò)在代數(shù)上表示了這樣一種因子分解關(guān)系:定義在所有隨機(jī)變量上的聯(lián)合分布可表示為所有最大團(tuán)勢函數(shù)的乘積再乘以一個歸一化因子,該歸一化因子是一個歸一化系數(shù),可看成是一個定義在隨機(jī)變量空集上的常值函數(shù),它是稱為配分函數(shù)的歸一化常數(shù)的倒數(shù);

馬爾可夫網(wǎng)絡(luò)的代數(shù)表示如下:馬爾可夫網(wǎng)絡(luò)MN(X,L)表示為一個聯(lián)合分布的因子分解關(guān)系其中,p(X)是定義在隨機(jī)變量集X={x1,...,xK}上的聯(lián)合分布,Z-1是該因子分解中的歸一化因子,配分函數(shù)是一個歸一化常數(shù),每個因子是定義在最大團(tuán)Cn中所有節(jié)點(diǎn)所對應(yīng)的隨機(jī)變量子集上的一個最大團(tuán)勢函數(shù),每個最大團(tuán)是一個最大完全子圖,其中所有節(jié)點(diǎn)對均通過一條無向邊進(jìn)行連接,所有這樣的無向邊構(gòu)成馬爾可夫網(wǎng)絡(luò)MN(X,L)的無向邊集L。

上述因子圖進(jìn)一步包括:

因子圖的圖形表示如下:因子圖是由變量節(jié)點(diǎn)與因子節(jié)點(diǎn)所構(gòu)成的一個二分圖,其中,每個變量節(jié)點(diǎn)表示變量集中的一個變量,每個因子節(jié)點(diǎn)表示定義在變量子集上的一個局部函數(shù),當(dāng)且僅當(dāng)某個變量是一個局部函數(shù)的自變量時,該變量節(jié)點(diǎn)與該因子節(jié)點(diǎn)之間有一條無向邊,于是,定義在變量集上的一個全局函數(shù)可表示為所有定義在變量子集上的局部函數(shù)的乘積;當(dāng)全局函數(shù)用于表示一組隨機(jī)變量的聯(lián)合分布時,因子圖成為一種新穎的概率圖模型;

因子圖的代數(shù)表示如下:因子圖FG(X,F,E)表示為一個全局函數(shù)的因子分解關(guān)系其中,h(X)是定義在變量集X={x1,...,xK}上的全局函數(shù),每個局部函數(shù)fj(Xj),j∈{1,...,J}稱為定義在變量子集上的一個因子,所有這樣的局部函數(shù)構(gòu)成因子圖FG(X,F,E)的局部函數(shù)集F={f1,...,fJ},同時,因子圖FG(X,F,E)的無向邊集E={(xj,fj)|iif xj∈Xj};當(dāng)全局函數(shù)h(X)用于表示定義在隨機(jī)變量集X上的聯(lián)合分布時,因子圖FG(X,F,E)成為一個概率圖模型。

S2:依次按轉(zhuǎn)換規(guī)則1、2和3將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖:

轉(zhuǎn)換規(guī)則1:創(chuàng)建因子圖的所有變量節(jié)點(diǎn),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)的所有隨機(jī)變量節(jié)點(diǎn);

轉(zhuǎn)換規(guī)則1的代數(shù)表示如下:將馬爾可夫網(wǎng)絡(luò)MN(X,L)中全部K個隨機(jī)變量xk∈X,k∈{1,...,K}對應(yīng)地轉(zhuǎn)換為因子圖FG(X,F,E)中的K個變量

轉(zhuǎn)換規(guī)則2:創(chuàng)建因子圖的所有因子節(jié)點(diǎn)即局部函數(shù),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)中表示的所有最大團(tuán)勢函數(shù);

轉(zhuǎn)換規(guī)則2的代數(shù)表示如下:將馬爾可夫網(wǎng)絡(luò)MN(X,L)中全部N個最大團(tuán)勢函數(shù)對應(yīng)地轉(zhuǎn)換為因子圖FG(X,F,E)中J=N個局部函數(shù)fj∈F,j∈{1,...,J};

轉(zhuǎn)換規(guī)則3:當(dāng)且僅當(dāng)因子圖中某個變量是一個局部函數(shù)的自變量時,添加連接該變量節(jié)點(diǎn)與該局部函數(shù)即因子節(jié)點(diǎn)的無向邊;

轉(zhuǎn)換規(guī)則3的代數(shù)表示如下:令因子圖FG(X,F,E)中全部J=N個局部函數(shù)fj∈F,j∈{1,...,J}分別表示馬爾可夫網(wǎng)絡(luò)MN(X,L)中N個最大團(tuán)勢函數(shù),即這些因子圖局部函數(shù)它們表示了因子圖的無向邊集E={(xj,fj)|iif xj∈Xj};令該因子圖的全局函數(shù)h(X)表示定義在隨機(jī)變量集X上的聯(lián)合分布再乘以該馬爾可夫網(wǎng)絡(luò)中的歸一化常數(shù)Z,即:h(X)=p(X)×Z;于是,該因子圖所表示的因子分解關(guān)系即為它等價于J=N,該因子分解關(guān)系與馬爾可夫網(wǎng)絡(luò)MN(X,L)所表示的因子分解關(guān)系完全等價。

S3:輸出轉(zhuǎn)換成的因子圖FG(X,F,E)。

以本發(fā)明的上述方法為基礎(chǔ),可以進(jìn)一步構(gòu)建一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的系統(tǒng)100,如圖2所示,包括:馬爾可夫網(wǎng)絡(luò)輸入模塊101、馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換模塊102、因子圖輸出模塊103、人機(jī)交互界面104,其中:

所述馬爾可夫網(wǎng)絡(luò)輸入模塊101用于實(shí)現(xiàn)本發(fā)明方法中的步驟S1:輸入待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò);

所述馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換模塊102用于實(shí)現(xiàn)本發(fā)明方法中的步驟S2:依次按轉(zhuǎn)換規(guī)則1、2和3將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖;該模塊進(jìn)一步包括三個子模塊:因子圖的變量節(jié)點(diǎn)創(chuàng)建子模塊1021、因子圖的因子節(jié)點(diǎn)創(chuàng)建子模塊1022和因子圖的無向邊添加子模塊1023,它們依次分別按轉(zhuǎn)換規(guī)則1、2和3實(shí)現(xiàn)將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖:

轉(zhuǎn)換規(guī)則1:創(chuàng)建因子圖的所有變量節(jié)點(diǎn),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)的所有隨機(jī)變量節(jié)點(diǎn);

轉(zhuǎn)換規(guī)則2:創(chuàng)建因子圖的所有因子節(jié)點(diǎn)即局部函數(shù),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)中表示的所有最大團(tuán)勢函數(shù);

轉(zhuǎn)換規(guī)則3:當(dāng)且僅當(dāng)因子圖中某個變量是一個局部函數(shù)的自變量時,添加連接該變量節(jié)點(diǎn)與該局部函數(shù)即因子節(jié)點(diǎn)的無向邊;

所述因子圖輸出模塊103用于實(shí)現(xiàn)本發(fā)明方法中的步驟S3:輸出轉(zhuǎn)換成的因子圖;

所述人機(jī)交互界面104用于實(shí)現(xiàn)用戶與該系統(tǒng)之間的人機(jī)交互,包括:用戶通過此界面輸入并圖示一個馬爾可夫網(wǎng)絡(luò),用戶通過此界面提交馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的執(zhí)行指令,用戶通過此界面輸出并圖示一個轉(zhuǎn)換成的因子圖。

上述將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的系統(tǒng)100可采用的實(shí)現(xiàn)技術(shù)包括:

馬爾可夫網(wǎng)絡(luò)輸入模塊101可采用常規(guī)的程序設(shè)計語言(如:C++、Java、Python、R等)通過編程及函數(shù)調(diào)用來實(shí)現(xiàn),輸入的馬爾可夫網(wǎng)絡(luò)以數(shù)據(jù)文件的形式進(jìn)行存儲,數(shù)據(jù)存儲格式可采用一般的無向圖(undirected graph,UG)的數(shù)據(jù)存儲格式(如:文本文件、CSV文件、XML文檔等);作為一個可選項(xiàng),輸入的馬爾可夫網(wǎng)絡(luò)可進(jìn)一步以無向圖(UG)的形式在人機(jī)交互界面104進(jìn)行圖示。

馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換模塊102可采用常規(guī)的程序設(shè)計語言(如:C++、Java、Python、R等)通過編程實(shí)現(xiàn);轉(zhuǎn)換過程中,需讀取已存儲的馬爾可夫網(wǎng)絡(luò)數(shù)據(jù)文件,產(chǎn)生的因子圖中間結(jié)果和最終結(jié)果以數(shù)據(jù)文件的形式進(jìn)行存儲,數(shù)據(jù)存儲格式可采用一般的二分圖(bipartite graph,BG)的數(shù)據(jù)存儲格式(如:文本文件、CSV文件、XML文檔等)。

因子圖輸出模塊103可采用常規(guī)的程序設(shè)計語言(如:C++、Java、Python、R等)通過編程及函數(shù)調(diào)用來實(shí)現(xiàn),通過讀取已存儲的因子圖(最終結(jié)果)數(shù)據(jù)文件,以二分圖(BG)的形式在人機(jī)交互界面104進(jìn)行圖示。

人機(jī)交互界面104可使用常規(guī)的人機(jī)交互界面實(shí)現(xiàn)技術(shù),其中,基于已存儲的圖數(shù)據(jù),輸入的馬爾可夫網(wǎng)絡(luò)可采用一般的無向圖(UG)可視化技術(shù)在界面上進(jìn)行顯示,轉(zhuǎn)換所得的因子圖可采用一般的二分圖(BG)可視化技術(shù)在界面上進(jìn)行圖示,兩者的圖示也可以通過調(diào)用開源的圖模型工具包中的有關(guān)函數(shù)來實(shí)現(xiàn),如工具包GMTK—The Graphical Models Toolkit(http://melodi.ee.washington.edu/gmtk/)。

下面再通過一個優(yōu)選實(shí)施例來進(jìn)一步描述本發(fā)明技術(shù)方案的具體實(shí)施方式,并進(jìn)一步具體表明本發(fā)明的前述有益技術(shù)效果。本優(yōu)選實(shí)施例中馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的過程與規(guī)則如圖3所示。

本發(fā)明的一種將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖的方法,如圖3所示,包括下列步驟:

S1:輸入待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò);不失一般性,設(shè)輸入的馬爾可夫網(wǎng)絡(luò)MN如圖3(A)所示,本實(shí)施例的具體情況如下:

馬爾可夫網(wǎng)絡(luò)MN的圖形表示如圖3(A)所示:該馬爾可夫網(wǎng)絡(luò)是一個含有7個隨機(jī)變量節(jié)點(diǎn)的無向圖,定義在所有隨機(jī)變量上的聯(lián)合分布可表示為所有最大團(tuán)勢函數(shù)的乘積再乘以一個歸一化因子Z-1。

馬爾可夫網(wǎng)絡(luò)MN的代數(shù)表示如圖3(A)的右側(cè)所示:定義在隨機(jī)變量集X={x1,...,x7}上的聯(lián)合分布p(X)=p(x1,...,x7),定義在全部3個最大團(tuán)C1,C2,C3所對應(yīng)的隨機(jī)變量子集上的最大團(tuán)勢函數(shù)分別是于是,該馬爾可夫網(wǎng)絡(luò)所表示的聯(lián)合分布的因子分解關(guān)系具體為:

S2:依次按轉(zhuǎn)換規(guī)則1、2和3將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖:

轉(zhuǎn)換規(guī)則1:創(chuàng)建因子圖的所有變量節(jié)點(diǎn),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)的所有隨機(jī)變量節(jié)點(diǎn);

轉(zhuǎn)換規(guī)則1的代數(shù)表示如下:將馬爾可夫網(wǎng)絡(luò)MN(X,L)中全部K個隨機(jī)變量xk∈X,k∈{1,...,K}對應(yīng)地轉(zhuǎn)換為因子圖FG(X,F,E)中的K個變量如圖3(A)到圖3(B-1)之間的“第一步轉(zhuǎn)換”所示,本實(shí)施例的具體情況如下:

創(chuàng)建的因子圖變量為:x1,...,x7分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)MN的隨機(jī)變量x1,...,x7。

轉(zhuǎn)換規(guī)則2:創(chuàng)建因子圖的所有因子節(jié)點(diǎn)即局部函數(shù),它們分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)中表示的所有最大團(tuán)勢函數(shù);

轉(zhuǎn)換規(guī)則2的代數(shù)表示如下:將馬爾可夫網(wǎng)絡(luò)MN(X,L)中全部N個最大團(tuán)勢函數(shù)對應(yīng)地轉(zhuǎn)換為因子圖FG(X,F,E)中J=N個局部函數(shù)fj∈F,j∈{1,...,J};如圖3(B-1)到圖3(B-2)之間的“第二步轉(zhuǎn)換”所示,本實(shí)施例的具體情況如下:

創(chuàng)建的因子圖的所有因子節(jié)點(diǎn)即局部函數(shù)具體為:f1,f2,f3分別對應(yīng)于馬爾可夫網(wǎng)絡(luò)MN所表示的上述最大團(tuán)勢函數(shù):

轉(zhuǎn)換規(guī)則3:當(dāng)且僅當(dāng)因子圖中某個變量是一個局部函數(shù)的自變量時,添加連接該變量節(jié)點(diǎn)與該局部函數(shù)即因子節(jié)點(diǎn)的無向邊;

轉(zhuǎn)換規(guī)則3的代數(shù)表示如下:令因子圖FG(X,F,E)中全部J=N個局部函數(shù)fj∈F,j∈{1,...,J}分別表示馬爾可夫網(wǎng)絡(luò)MN(X,L)中N個最大團(tuán)勢函數(shù),即這些因子圖局部函數(shù)它們表示了因子圖的無向邊集E={(xj,fj)|iif xj∈Xj};令該因子圖的全局函數(shù)h(X)表示定義在隨機(jī)變量集X上的聯(lián)合分布再乘以該馬爾可夫網(wǎng)絡(luò)中的歸一化常數(shù)Z,即:h(X)=p(X)×Z;于是,該因子圖所表示的因子分解關(guān)系即為它等價于J=N,該因子分解關(guān)系與馬爾可夫網(wǎng)絡(luò)MN(X,L)所表示的因子分解關(guān)系完全等價;如圖3(B-2)到圖3(B-3)之間的“第三步轉(zhuǎn)換”所示,本實(shí)施例的具體情況如下:

令因子圖FG中全部3個局部函數(shù)f1,f2,f3分別表示馬爾可夫網(wǎng)絡(luò)MN中最大團(tuán)勢函數(shù):

這些局部函數(shù)對應(yīng)表示了因子圖FG的無向邊集:

E={(x1,f1),(x2,f1),(x2,f2),(x3,f2),(x4,f2),(x4,f3),(x5,f3),(x6,f3),(x7,f3)}。

令因子圖FG的全局函數(shù)h(X)表示定義在隨機(jī)變量集X={x1,...,x7}上的聯(lián)合分布再乘以馬爾可夫網(wǎng)絡(luò)MN中歸一化常數(shù)Z,即h(X)=p(X)×Z。于是,因子圖FG所表示的全局函數(shù)的因子分解關(guān)系具體為:

它等價于:

以上因子分解與馬爾可夫網(wǎng)絡(luò)BN所表示的聯(lián)合分布的因子分解關(guān)系完全等價,表明已將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖。

S3:輸出轉(zhuǎn)換成的因子圖,本實(shí)施例的具體情況如下:

輸出轉(zhuǎn)換成的因子圖FG,見圖3(B-3),該因子圖由馬爾可夫網(wǎng)絡(luò)BN等價轉(zhuǎn)換而得。

由本發(fā)明上述技術(shù)方案(包括方法及系統(tǒng))及其具體實(shí)施方式(包括優(yōu)選實(shí)施例)可理解出各處理步驟的技術(shù)效果和所解決的技術(shù)問題如下:

步驟S1所取得的技術(shù)效果是:輸入了待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò),該馬爾可夫網(wǎng)絡(luò)的圖形表示及對應(yīng)的代數(shù)表示可進(jìn)行數(shù)據(jù)存儲;從而解決了技術(shù)問題:如何輸入待轉(zhuǎn)換為因子圖的馬爾可夫網(wǎng)絡(luò)。這樣,為本發(fā)明總體技術(shù)問題的解決創(chuàng)造了不可或缺的必要條件。

步驟S2所取得的技術(shù)效果是:基于馬爾可夫網(wǎng)絡(luò)數(shù)據(jù)存儲,將馬爾可夫網(wǎng)絡(luò)的圖形表示及對應(yīng)的代數(shù)表示等價轉(zhuǎn)換為因子圖的圖形表示及對應(yīng)的代數(shù)表示,并可進(jìn)行數(shù)據(jù)存儲;從而解決了技術(shù)問題:如何將馬爾可夫網(wǎng)絡(luò)等價轉(zhuǎn)換為因子圖。這樣,為本發(fā)明總體技術(shù)問題的解決創(chuàng)造了不可或缺的必要條件。

步驟S3所取得的技術(shù)效果是:基于轉(zhuǎn)換所得的因子圖數(shù)據(jù)存儲,輸出等價轉(zhuǎn)換成的因子圖;從而解決了技術(shù)問題:如何輸出轉(zhuǎn)換成的因子圖。這樣,為本發(fā)明總體技術(shù)問題的解決創(chuàng)造了不可或缺的必要條件。

總體來說,由本發(fā)明上述技術(shù)方案及其具體實(shí)施方式可以理解的是,本發(fā)明的有益技術(shù)效果主要包括三個方面:(1)克服了目前缺乏馬爾可夫網(wǎng)絡(luò)向因子圖等價轉(zhuǎn)換的完整、可實(shí)施技術(shù)方案的缺陷;(2)所提供的轉(zhuǎn)換方法簡單易行、轉(zhuǎn)換系統(tǒng)易于實(shí)現(xiàn);(3)所提供的轉(zhuǎn)換方法及系統(tǒng)在概率建模與推理、機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等領(lǐng)域具有廣闊的應(yīng)用前景。

以上所述僅是本發(fā)明的部分實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1