最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法

文檔序號(hào):41953106發(fā)布日期:2025-05-16 14:16閱讀:4來(lái)源:國(guó)知局
一種基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法

本發(fā)明涉及一種基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,屬于人工智能的生物信息處理。


背景技術(shù):

1、蛋白質(zhì)與配體之間的結(jié)合親和力是藥物設(shè)計(jì)中的關(guān)鍵要素之一。準(zhǔn)確預(yù)測(cè)這種結(jié)合親和力可以幫助研究人員快速篩選潛在的藥物分子,從而加速藥物開(kāi)發(fā)過(guò)程。近年來(lái),隨著計(jì)算生物學(xué)和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于圖神經(jīng)網(wǎng)絡(luò)的方法被廣泛應(yīng)用于從蛋白質(zhì)-配體復(fù)合物中提取特征并用于結(jié)合親和力的預(yù)測(cè),這大大加速了藥物設(shè)計(jì)的進(jìn)程。

2、目前,對(duì)于使用圖神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)蛋白質(zhì)-配體結(jié)合親和力,主流的思路是通過(guò)學(xué)習(xí)蛋白質(zhì)-配體復(fù)合物中的共價(jià)與非共價(jià)相互作用來(lái)預(yù)測(cè)親和力。常見(jiàn)的方法主要分為兩類:其中一類方法將復(fù)合物建模成一張圖,將共價(jià)與非共價(jià)相互作用視為同一種相互作用,直接輸入至圖神經(jīng)網(wǎng)絡(luò)中提取特征并預(yù)測(cè)親和力。但是由于非共價(jià)相互作用邊的數(shù)量遠(yuǎn)大于共價(jià)相互作用邊,所以此類方法可能會(huì)導(dǎo)致非共價(jià)相互作用信息淹沒(méi)共價(jià)相互作用信息。另一類則將復(fù)合物構(gòu)建為蛋白質(zhì)圖、配體圖和蛋白質(zhì)-配體相互作用圖三張圖,并通過(guò)兩個(gè)階段的消息傳遞分別提取復(fù)合物中的共價(jià)與非共價(jià)相互作用,防止共價(jià)相互作用信息被淹沒(méi)。

3、然而,現(xiàn)有方法在學(xué)習(xí)復(fù)合物中的非共價(jià)相互作用方面存在不足,由于復(fù)合物中非共價(jià)鍵并非顯式存在,所以首先需要人為設(shè)定閾值來(lái)確定非共價(jià)邊,然后通過(guò)消息傳遞學(xué)習(xí)非共價(jià)相互作用。這種方法會(huì)導(dǎo)致兩種問(wèn)題:首先是會(huì)引入錯(cuò)誤的非共價(jià)邊,導(dǎo)致消息傳遞時(shí)出現(xiàn)噪聲,進(jìn)而影響預(yù)測(cè)結(jié)果的準(zhǔn)確性;另外一點(diǎn)是會(huì)忽略一些原子間的長(zhǎng)距離相互作用,因?yàn)檫@些相互作用可能不滿足預(yù)設(shè)的距離閾值條件,從而無(wú)法被正確地識(shí)別和處理。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提出了一種基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,以提高現(xiàn)有技術(shù)中對(duì)非共價(jià)相互作用學(xué)習(xí)的準(zhǔn)確性和全面性,從而提升對(duì)于蛋白質(zhì)-配體結(jié)合親和力的預(yù)測(cè)性能。本發(fā)明具體技術(shù)方案為:

2、基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法步驟如下:

3、步驟1:獲取包含蛋白質(zhì)-配體3d復(fù)合物及對(duì)應(yīng)親和力標(biāo)簽的數(shù)據(jù)集,并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建并保存為二進(jìn)制復(fù)合物文件;

4、步驟2:基于所述二進(jìn)制復(fù)合物文件構(gòu)建復(fù)合物圖,該圖包括節(jié)點(diǎn)特征、共價(jià)相互作用邊以及非共價(jià)相互作用邊;

5、步驟3:構(gòu)建雙虛擬節(jié)點(diǎn)消息傳遞模塊,用于學(xué)習(xí)復(fù)合物圖中的共價(jià)與非共價(jià)相互作用;

6、步驟4:更新虛擬節(jié)點(diǎn),通過(guò)上一輪聚合更新后的節(jié)點(diǎn)特征對(duì)虛擬節(jié)點(diǎn)進(jìn)行更新;

7、步驟5:使用求和池化技術(shù)處理最終的復(fù)合物圖,并將其輸入多層感知機(jī)以預(yù)測(cè)親和力。

8、具體的,所述步驟1中獲取數(shù)據(jù)集、構(gòu)建二進(jìn)制復(fù)合物文件的詳細(xì)過(guò)程為,通過(guò)公開(kāi)數(shù)據(jù)庫(kù)獲取原始數(shù)據(jù)集后,使用分子可視化和分析工具加載復(fù)合物中的蛋白質(zhì)文件與配體文件,移除蛋白質(zhì)中的水分子與配體中的氫原子后選擇距離配體以內(nèi)的氨基酸殘基作為蛋白質(zhì)口袋,并將該口袋保存為蛋白質(zhì)口袋文件,接著加載生成的蛋白質(zhì)口袋文件與配體文件,打包成一個(gè)元組并序列化保存為二進(jìn)制復(fù)合物文件。

9、具體的,所述步驟2中構(gòu)建復(fù)合物圖的詳細(xì)過(guò)程包括:

10、步驟2.1:提取每個(gè)復(fù)合物文件中的蛋白質(zhì)口袋與配體中的原子信息、共價(jià)鍵與非共價(jià)鍵信息,轉(zhuǎn)換為復(fù)合物圖g=(v,e),其中v是圖中所有節(jié)點(diǎn)的集合,e包含兩種類型的邊:共價(jià)相互作用邊ecov和非共價(jià)相互作用邊encov,共價(jià)相互作用邊根據(jù)兩個(gè)節(jié)點(diǎn)間是否存在共價(jià)鍵來(lái)定義,非共價(jià)相互作用邊則根據(jù)蛋白質(zhì)與配體間的原子間距離是否小于這個(gè)閾值來(lái)定義;

11、步驟2.2:對(duì)于邊特征eij,根據(jù)兩個(gè)節(jié)點(diǎn)在三維空間中的相對(duì)距離并輸入到徑向基函數(shù)中計(jì)算得到;對(duì)于節(jié)點(diǎn)特征h,根據(jù)六類信息(符號(hào)、原子度、隱含價(jià)數(shù)、雜化程度、芳香性及相鄰氫原子數(shù))計(jì)算得到;隨后對(duì)非共價(jià)邊條件下各節(jié)點(diǎn)的度信息進(jìn)行對(duì)數(shù)變換,額外保存到復(fù)合物圖數(shù)據(jù)中。

12、具體的,所述步驟3中構(gòu)建雙虛擬節(jié)點(diǎn)消息傳遞模塊的詳細(xì)過(guò)程包括:

13、步驟3.1:在復(fù)合物圖中初始化兩個(gè)虛擬節(jié)點(diǎn),分別代表整個(gè)蛋白質(zhì)vv_p和整個(gè)配體vv_l,并將兩個(gè)虛擬節(jié)點(diǎn)的嵌入向量設(shè)置為零向量;

14、步驟3.2:通過(guò)普通的消息傳遞學(xué)習(xí)共價(jià)相互作用;對(duì)于非共價(jià)相互作用的學(xué)習(xí),首先將非共價(jià)度信息與原始的節(jié)點(diǎn)特征拼接后,通過(guò)一個(gè)全連接層,計(jì)算出每個(gè)蛋白質(zhì)和配體節(jié)點(diǎn)與虛擬配體節(jié)點(diǎn)、虛擬蛋白質(zhì)節(jié)點(diǎn)的融合比例,具體計(jì)算公式如下所示:

15、

16、其中,代表節(jié)點(diǎn)i的上一層特征,di表示節(jié)點(diǎn)i的非共價(jià)度信息,σ表示激活函數(shù),mlpgate是一個(gè)多層感知機(jī),用于計(jì)算虛擬節(jié)點(diǎn)融合比例,最后根據(jù)計(jì)算得到的融合比例與虛擬節(jié)點(diǎn)進(jìn)行融合,得到融合后的節(jié)點(diǎn)特征,具體計(jì)算公式如下:

17、

18、其中,vv_target(i)是目標(biāo)虛擬節(jié)點(diǎn)(對(duì)于蛋白質(zhì)節(jié)點(diǎn)i,目標(biāo)是虛擬配體節(jié)點(diǎn)vv_l,反之亦然),隨后再進(jìn)行一次消息傳遞,最終將經(jīng)過(guò)共價(jià)消息傳遞與雙虛擬節(jié)點(diǎn)消息傳遞的結(jié)果分別輸入兩個(gè)全連接層后相加,并通過(guò)殘差連接加上上一輪的節(jié)點(diǎn)特征完成最終的消息傳遞,具體計(jì)算公式如下:

19、

20、其中,mlpcov和mlpncov分別是用于處理共價(jià)和非共價(jià)相互作用的多層感知機(jī)。

21、具體的,所述步驟4中,更新虛擬節(jié)點(diǎn)的詳細(xì)過(guò)程為:在每輪消息傳遞結(jié)束后進(jìn)行虛擬節(jié)點(diǎn)的更新,首先計(jì)算蛋白質(zhì)和配體節(jié)點(diǎn)當(dāng)前階段的特征平均值,然后利用多層感知機(jī)處理這些值并通過(guò)縮放因子調(diào)整更新幅度,vv_p和vv_l具體的更新公式為:

22、

23、其中,sp和sl分別是可學(xué)習(xí)的縮放因子,用于控制虛擬節(jié)點(diǎn)的更新幅度。

24、具體的,所述步驟5中,預(yù)測(cè)親和力的詳細(xì)過(guò)程為:在親和力預(yù)測(cè)時(shí)需經(jīng)過(guò)四輪步驟3和步驟4的操作,充分學(xué)習(xí)蛋白質(zhì)-配體復(fù)合物中的共價(jià)與非共價(jià)相互作用后,再對(duì)復(fù)合物圖進(jìn)行求和池化,并將結(jié)果輸入到多層感知機(jī)中預(yù)測(cè)蛋白質(zhì)與配體的結(jié)合親和力。

25、基于上述,本發(fā)明提出的一種基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,通過(guò)引入雙虛擬節(jié)點(diǎn)消息傳遞機(jī)制,使得模型能夠在每次迭代時(shí)綜合全局信息,而不僅僅是依賴局部的相互作用。通過(guò)這種方式,即使某些局部相互作用未能被正確識(shí)別,全局信息仍然可以幫助修正這些誤差,提高了模型對(duì)復(fù)雜相互作用模式的理解和學(xué)習(xí)能力;并且通過(guò)動(dòng)態(tài)調(diào)整虛擬節(jié)點(diǎn)的貢獻(xiàn)來(lái)增強(qiáng)模型對(duì)復(fù)雜相互作用模式的理解和學(xué)習(xí),能夠更精準(zhǔn)地捕捉復(fù)合物中的非共價(jià)相互作用,減少了由于固定閾值導(dǎo)致的信息丟失或噪聲干擾,提升了模型的魯棒性和泛化能力。



技術(shù)特征:

1.一種基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,其特征在于,包括以下步驟:

2.根據(jù)權(quán)利要求1所述的基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,其特征在于,所述步驟1中,通過(guò)公開(kāi)數(shù)據(jù)庫(kù)獲取原始數(shù)據(jù)集后,使用分子可視化和分析工具加載復(fù)合物中的蛋白質(zhì)文件與配體文件,移除蛋白質(zhì)中的水分子與配體中的氫原子后選擇距離配體以內(nèi)的氨基酸殘基作為蛋白質(zhì)口袋,并將該口袋保存為蛋白質(zhì)口袋文件,接著加載生成的蛋白質(zhì)口袋文件與配體文件,打包成一個(gè)元組并序列化保存為二進(jìn)制復(fù)合物文件。

3.根據(jù)權(quán)利要求1所述的基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,其特征在于,所述步驟2中,構(gòu)建復(fù)合物圖的具體步驟包括:

4.根據(jù)權(quán)利要求1所述的基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,其特征在于,所述步驟3中,構(gòu)建雙虛擬節(jié)點(diǎn)消息傳遞模塊的具體步驟包括:

5.根據(jù)權(quán)利要求1所述的基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,其特征在于,所述步驟4中,虛擬節(jié)點(diǎn)在每輪消息傳遞結(jié)束后進(jìn)行更新,首先計(jì)算蛋白質(zhì)和配體節(jié)點(diǎn)當(dāng)前階段的特征平均值,然后利用多層感知機(jī)處理這些值并通過(guò)縮放因子調(diào)整更新幅度,vv_p和vv_l具體的更新公式為:

6.根據(jù)權(quán)利要求1所述的基于雙虛擬節(jié)點(diǎn)消息傳遞的蛋白質(zhì)-配體結(jié)合親和力預(yù)測(cè)方法,其特征在于,所述步驟5中,在親和力預(yù)測(cè)時(shí)需經(jīng)過(guò)四輪步驟3和步驟4的操作,充分學(xué)習(xí)蛋白質(zhì)-配體復(fù)合物中的共價(jià)與非共價(jià)相互作用后,再對(duì)復(fù)合物圖進(jìn)行求和池化,并將結(jié)果輸入到多層感知機(jī)中預(yù)測(cè)蛋白質(zhì)與配體的結(jié)合親和力。


技術(shù)總結(jié)
本發(fā)明提供了一種基于雙虛擬節(jié)點(diǎn)消息傳遞機(jī)制的蛋白質(zhì)?配體結(jié)合親和力預(yù)測(cè)方法,屬于計(jì)算機(jī)輔助藥物設(shè)計(jì)技術(shù)以及生物和藥物信息學(xué)領(lǐng)域;所述方法首先需要準(zhǔn)備好蛋白質(zhì)?配體復(fù)合物的三維結(jié)構(gòu)數(shù)據(jù)集,并在預(yù)處理之后構(gòu)建為復(fù)合物圖結(jié)構(gòu);隨后通過(guò)本發(fā)明提出的雙虛擬節(jié)點(diǎn)消息傳遞模塊充分學(xué)習(xí)蛋白質(zhì)?配體復(fù)合物中的相互作用;經(jīng)過(guò)多層消息傳遞后,通過(guò)求和池化,將最終的復(fù)合物特征輸入至多層感知機(jī)獲得親和力預(yù)測(cè)值;本發(fā)明通過(guò)引入兩個(gè)虛擬節(jié)點(diǎn)表示蛋白質(zhì)與配體的整體特征,使模型能夠在每次消息傳遞時(shí)感知全局信息,彌補(bǔ)人工定義閾值造成的偏差,增強(qiáng)模型對(duì)復(fù)雜相互作用模式的理解和學(xué)習(xí)能力,提高了對(duì)蛋白質(zhì)?配體結(jié)合親和力預(yù)測(cè)的準(zhǔn)確性。

技術(shù)研發(fā)人員:周國(guó)強(qiáng),李犇
受保護(hù)的技術(shù)使用者:南京郵電大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1