本公開涉及因果發(fā)現(xiàn),具體涉及一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法及系統(tǒng)。
背景技術(shù):
1、因果發(fā)現(xiàn)的核心在于揭示觀察現(xiàn)象背后的潛在機制。在復(fù)雜系統(tǒng)中,區(qū)分因果關(guān)系與單純相關(guān)性對于有效設(shè)計干預(yù)措施和制定政策至關(guān)重要;然而,傳統(tǒng)的因果發(fā)現(xiàn)方法主要聚焦于分析系統(tǒng)中個體之間的相互影響,往往忽視了多個個體結(jié)合所形成的集體行為。
2、實際上,在生態(tài)系統(tǒng)、經(jīng)濟系統(tǒng)以及社會網(wǎng)絡(luò)中,個體行為的集體作用常常能夠引發(fā)非線性的反饋效應(yīng),深刻影響系統(tǒng)的動態(tài)變化;這種集體行為的復(fù)雜性使得傳統(tǒng)因果發(fā)現(xiàn)方法難以準(zhǔn)確捕捉系統(tǒng)內(nèi)部的動態(tài)特征,尤其是在許多現(xiàn)實復(fù)雜系統(tǒng)中,個體間的相互作用并非簡單的線性疊加,而是源于復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)及多尺度的交互關(guān)系,從而使得集體行為展現(xiàn)出復(fù)雜的非線性特征。這種非線性關(guān)系表明,微小的變化可能引發(fā)系統(tǒng)內(nèi)的顯著反應(yīng),而傳統(tǒng)方法在識別和建模這一復(fù)雜性方面存在不足,進而導(dǎo)致發(fā)現(xiàn)的因果關(guān)系出現(xiàn)遺漏以及偏差。此外,集體狀態(tài)的抽象性與現(xiàn)有的基于得分的因果發(fā)現(xiàn)算法的局部優(yōu)化策略,則進一步增加了研究非線性影響的難度,使得從數(shù)據(jù)中提取有效因果信息的過程更加復(fù)雜。
3、因此,現(xiàn)有因果發(fā)現(xiàn)方法,缺乏對集體行為的深入理解及其非線性影響的探討,無法準(zhǔn)確地揭示復(fù)雜系統(tǒng)中的因果機制。
技術(shù)實現(xiàn)思路
1、本公開為了解決上述問題,提出了一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法及系統(tǒng),創(chuàng)新性地構(gòu)建了集體行為建??蚣埽軌蛴行ёR別驅(qū)動狀態(tài)變化的關(guān)鍵集體行為,提高了因果發(fā)現(xiàn)的準(zhǔn)確性、合理性和魯棒性。
2、根據(jù)一些實施例,本公開采用如下技術(shù)方案:
3、一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,包括:
4、獲取單細(xì)胞rna測序數(shù)據(jù),所述單細(xì)胞rna測序數(shù)據(jù)為若干個細(xì)胞的基因表達矩陣;
5、將預(yù)處理后的單細(xì)胞rna測序數(shù)據(jù),輸入到多尺度因果模型中進行推理,得到多尺度因果圖,所述多尺度因果圖用于描述基因與基因、基因與基因程序之間的多尺度因果關(guān)系;
6、其中,所述多尺度因果模型,將單個基因作為個體變量,通過集體行為建模,聚合為表征基因程序的集體變量,并采用多尺度協(xié)同學(xué)習(xí)策略,協(xié)同學(xué)習(xí)個體與個體、個體與集體之間的多尺度因果關(guān)系。
7、根據(jù)一些實施例,本公開采用如下技術(shù)方案:
8、一種基于集體行為建模的多尺度因果發(fā)現(xiàn)系統(tǒng),包括:
9、數(shù)據(jù)獲取模塊,被配置為:獲取單細(xì)胞rna測序數(shù)據(jù),所述單細(xì)胞rna測序數(shù)據(jù)為若干個細(xì)胞的基因表達矩陣;
10、因果發(fā)現(xiàn)模塊,被配置為:將預(yù)處理后的單細(xì)胞rna測序數(shù)據(jù),輸入到多尺度因果模型中進行推理,得到多尺度因果圖,所述多尺度因果圖用于描述基因與基因、基因與基因程序之間的多尺度因果關(guān)系;
11、其中,所述多尺度因果模型,將單個基因作為個體變量,通過集體行為建模,聚合為表征基因程序的集體變量,并采用多尺度協(xié)同學(xué)習(xí)策略,協(xié)同學(xué)習(xí)個體與個體、個體與集體之間的多尺度因果關(guān)系。
12、根據(jù)一些實施例,本公開采用如下技術(shù)方案:
13、一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法。
14、根據(jù)一些實施例,本公開采用如下技術(shù)方案:
15、一種非暫態(tài)計算機可讀存儲介質(zhì),所述非暫態(tài)計算機可讀存儲介質(zhì)用于存儲計算機指令,所述計算機指令被處理器執(zhí)行時,實現(xiàn)所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法。
16、根據(jù)一些實施例,本公開采用如下技術(shù)方案:
17、一種電子設(shè)備,包括:處理器、存儲器以及計算機程序;其中,處理器與存儲器連接,計算機程序被存儲在存儲器中,當(dāng)電子設(shè)備運行時,所述處理器執(zhí)行所述存儲器存儲的計算機程序,以使電子設(shè)備執(zhí)行實現(xiàn)所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法。
18、與現(xiàn)有技術(shù)相比,本公開的有益效果為:
19、(1)本發(fā)明提出了一種基于注意力機制與多尺度協(xié)同學(xué)習(xí)的多尺度因果發(fā)現(xiàn)方法。該方法通過構(gòu)建集體表征模型,將個體變量聚合為集體變量,并采用兩階段優(yōu)化策略,協(xié)同學(xué)習(xí)個體與集體之間的多尺度因果關(guān)系,從而有效揭示復(fù)雜系統(tǒng)中的多尺度因果網(wǎng)絡(luò)結(jié)構(gòu)。
20、(2)本發(fā)明利用注意力機制動態(tài)計算個體對集體表征的貢獻權(quán)重,使集體行為建模具有可解釋性,同時支持從個體到集體尺度的因果關(guān)系發(fā)現(xiàn),為多尺度因果分析提供理論依據(jù)。
21、(3)本發(fā)明在優(yōu)化過程中引入跨尺度一致性約束,確保個體-個體、個體-集體和集體-個體三個部分的因果結(jié)構(gòu)相互協(xié)調(diào),避免因果環(huán)路,提高因果發(fā)現(xiàn)的合理性和魯棒性。
22、(4)本發(fā)明采用參數(shù)化因果提取策略,直接從優(yōu)化后的模型權(quán)重解碼多尺度因果關(guān)系,適用于生物醫(yī)學(xué)、社會科學(xué)等領(lǐng)域的多尺度因果分析。
1.一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,其特征在于,包括:
2.如權(quán)利要求1所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,其特征在于,所述基因表達矩陣,以細(xì)胞為行、基因為列,用于表征單個細(xì)胞在單個基因上的表達值;
3.如權(quán)利要求1所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,其特征在于,所述多尺度因果模型,包括集體行為建模模塊,該模塊利用基于注意力機制的深度學(xué)習(xí)模型,聚合個體變量得到集體變量,并動態(tài)計算個體變量對集體變量的權(quán)重矩陣。
4.如權(quán)利要求1所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,其特征在于,所述多尺度因果模型,還包括多尺度協(xié)同學(xué)習(xí)模塊,該模塊使用個體變量和集體變量共同以重構(gòu)為訓(xùn)練目標(biāo),引入跨尺度一致性約束,采用增廣拉格朗日方法,優(yōu)化學(xué)習(xí)個體變量對個體變量的權(quán)重矩陣、集體變量對個體變量的權(quán)重矩陣。
5.如權(quán)利要求4所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,其特征在于,所述以重構(gòu)為訓(xùn)練目標(biāo),引入跨尺度一致性約束,用公式表示為:
6.如權(quán)利要求1所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法,其特征在于,所述多尺度因果模型,還包括多尺度因果關(guān)系提取模塊,該模塊基于個體變量對個體變量的權(quán)重矩陣、集體變量對個體變量的權(quán)重矩陣、個體變量對集體變量的權(quán)重矩陣,分別提取個體到個體層面的因果關(guān)系,個體到集體層面的因果關(guān)系以及集體到個體尺度的因果關(guān)系,組成最終的多尺度因果圖。
7.一種基于集體行為建模的多尺度因果發(fā)現(xiàn)系統(tǒng),其特征在于,包括:
8.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-6任一項所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法。
9.一種非暫態(tài)計算機可讀存儲介質(zhì),其特征在于,所述非暫態(tài)計算機可讀存儲介質(zhì)用于存儲計算機指令,所述計算機指令被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1-6任一項所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法。
10.一種電子設(shè)備,其特征在于,包括:處理器、存儲器以及計算機程序;其中,處理器與存儲器連接,計算機程序被存儲在存儲器中,當(dāng)電子設(shè)備運行時,所述處理器執(zhí)行所述存儲器存儲的計算機程序,以使電子設(shè)備執(zhí)行實現(xiàn)如權(quán)利要求1-6任一項所述的一種基于集體行為建模的多尺度因果發(fā)現(xiàn)方法。