最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種用于分子動力學(xué)的芯片架構(gòu)模擬系統(tǒng)

文檔序號:41984793發(fā)布日期:2025-05-23 16:40閱讀:6來源:國知局
一種用于分子動力學(xué)的芯片架構(gòu)模擬系統(tǒng)

本發(fā)明涉及分子動力學(xué)計算領(lǐng)域,具體來說涉及計算芯片架構(gòu)模擬領(lǐng)域,更具體地說,涉及一種用于分子動力學(xué)的芯片架構(gòu)模擬系統(tǒng)。


背景技術(shù):

1、分子動力學(xué)(molecular?dynamics,簡稱md)是現(xiàn)代科學(xué)計算領(lǐng)域的重要研究方向之一。md模擬通過計算原子在微觀體系中的位置和速度隨時間的演化,從而獲得系統(tǒng)的動力學(xué)和熱力學(xué)特性。近年來,機器學(xué)習(xí)在高性能計算領(lǐng)域發(fā)揮著日益重要的作用,其中,神經(jīng)網(wǎng)絡(luò)分子動力學(xué)(neural?network?molecular?dynamics,簡稱nnmd)算法已成為該領(lǐng)域的主流方法。nnmd通過對第一性原理數(shù)據(jù)進行機器學(xué)習(xí)訓(xùn)練,在保證計算精度的同時顯著提升了計算效率。特別是深度勢能(deep?potential,簡稱dp)模型的表現(xiàn)尤為突出,能夠同時實現(xiàn)與第一性原理分子動力學(xué)(ab?initio?molecular?dynamics,簡稱aimd)相當(dāng)?shù)木群徒?jīng)驗力場(empirical?force?field,簡稱eff)方法級別的計算效率。

2、然而,目前基于deepmd(deep?potential?molecular?dynamics,一種基于機器學(xué)習(xí)的勢函數(shù)模型,主要用于分子動力學(xué)模擬)模型的加速方案主要依賴于通用高性能計算設(shè)備(如gpu、summit超算、神威太湖之光等),這些通用架構(gòu)在計算可擴展性方面存在明顯瓶頸。因此,開發(fā)專門面向deepmd模型的專用硬件加速器成為解決當(dāng)前挑戰(zhàn)的關(guān)鍵途徑。這種從通用架構(gòu)向?qū)S眉軜?gòu)的轉(zhuǎn)變需要對計算單元、存儲層次和片上互連進行深度定制化設(shè)計,以突破現(xiàn)有模擬效率的限制。

3、在硬件模擬工具方面,gem5(gems?and?m5)和systemc是當(dāng)前最具代表性的模擬平臺。這些工具在處理器架構(gòu)研究領(lǐng)域已獲得廣泛認可,特別是在cpu和gpu的周期精確(cycle-accurate)模擬方面具有突出優(yōu)勢。但在面向md領(lǐng)域的異構(gòu)加速器研究時,現(xiàn)有模擬器仍存在以下不足:

4、缺乏對分子動力學(xué)特定計算模式的深入優(yōu)化;沒有針對deepmd算法特性的專門模擬框架;對流式計算架構(gòu)的支持有限。

5、其中,流式計算架構(gòu)(streaming?computing?architecture)是一種以數(shù)據(jù)流為核心的計算模型,其特點是數(shù)據(jù)在處理單元之間以流水線方式流動,計算任務(wù)被分解為多個階段,每個階段由專用的硬件單元處理。這種架構(gòu)通過數(shù)據(jù)流的流水線處理,特別適合處理分子動力學(xué)模擬中的大規(guī)模原子間相互作用力的并行計算。流式計算架構(gòu)通過減少數(shù)據(jù)搬運和內(nèi)存訪問延遲,通常也稱為流水線(pipeline)。

6、現(xiàn)有模擬器(如gem5和systemc)主要針對通用計算架構(gòu)設(shè)計,缺乏對分子動力學(xué)特定計算模式的優(yōu)化,導(dǎo)致對流式計算架構(gòu)的支持有限。導(dǎo)致對流式計算架構(gòu)支持有限的原因具體表現(xiàn)為:

7、缺乏數(shù)據(jù)流優(yōu)化:現(xiàn)有模擬器未針對分子動力學(xué)中的數(shù)據(jù)流特性進行優(yōu)化,無法高效模擬受力計算過程;

8、任務(wù)分解與調(diào)度不足:流式計算架構(gòu)需要將計算任務(wù)分解為多個階段并動態(tài)調(diào)度,而現(xiàn)有模擬器缺乏自定義的受力計算框架;

9、并行度支持不足:流式計算架構(gòu)需要高并行度的硬件支持,而現(xiàn)有模擬器在并行度建模和調(diào)度方面存在局限性。

10、基于上述分析可知,現(xiàn)有模擬器存在以下問題:

11、1、其主要針對通用計算架構(gòu)設(shè)計,導(dǎo)致目前缺乏對分子動力學(xué)特定計算模式的優(yōu)化的問題;2、缺乏deepmd算法的專用模擬框架,無法高效模擬受力計算過程,導(dǎo)致對deepmd算法特性支持不足的問題;3、現(xiàn)有模擬器在任務(wù)分解、調(diào)度和并行度建模方面存在局限性,導(dǎo)致現(xiàn)有模擬器對流式計算架構(gòu)支持有限的問題。

12、需要說明的是:本背景技術(shù)僅用于介紹本發(fā)明的相關(guān)信息,以便于幫助理解本發(fā)明的技術(shù)方案,但并不意味著相關(guān)信息必然是現(xiàn)有技術(shù)。相關(guān)信息與本發(fā)明方案一同提交和公開,在沒有證據(jù)表明相關(guān)信息已在本發(fā)明的申請日以前公開的情況下,相關(guān)信息不應(yīng)被視為現(xiàn)有技術(shù)。


技術(shù)實現(xiàn)思路

1、因此,本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺陷,提供一種用于分子動力學(xué)的芯片架構(gòu)模擬系統(tǒng)。

2、本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的:

3、根據(jù)本發(fā)明的第一方面,提供一種用于分子動力學(xué)的芯片架構(gòu)模擬系統(tǒng),該系統(tǒng)用于模擬面向deepmd模型的加速器的受力計算過程,該系統(tǒng)包括可編程io模塊、地址映射模塊、數(shù)據(jù)傳輸模塊和異構(gòu)加速器;其中,可編程io模塊,用于通過主機訪問和控制異構(gòu)加速器;地址映射模塊,用于建立主機端內(nèi)存的虛擬地址與異構(gòu)加速器端的物理地址間的映射關(guān)系;數(shù)據(jù)傳輸模塊,用于根據(jù)映射關(guān)系執(zhí)行主機端內(nèi)存與異構(gòu)加速器間的數(shù)據(jù)傳輸,包括傳輸分子動力學(xué)中參與計算的原子信息;異構(gòu)加速器包括:計算邏輯子模塊,用于根據(jù)原子信息,采用流式計算架構(gòu)模擬deepmd模型對原子的受力計算過程,計算得到原子的受力,并統(tǒng)計受力計算時間;資源建模子模塊,用于評估計算邏輯子模塊在受力計算過程中的資源占用率;并行度調(diào)度子模塊,用于在所述資源占用率小于預(yù)設(shè)閾值的約束下,動態(tài)優(yōu)化計算邏輯子模塊的并行度,優(yōu)化目標(biāo)是最小化受力計算時間。

4、在本發(fā)明的一些實施例中,所述計算邏輯子模塊包括:原子管理單元,用于管理原子信息以及原子的受力計算過程的任務(wù)調(diào)度,原子信息包括多個原子、各個原子初始位置和初始速度;包括多個計算單元的總處理單元,用于通過多個計算單元采用流式計算架構(gòu),根據(jù)原子信息模擬原子的受力計算過程的多個推理階段,得到原子的受力,并統(tǒng)計受力計算時間,其中,多個推理階段是基于將deepmd模型對原子的受力計算過程分解得到的。

5、在本發(fā)明的一些實施例中,所述總處理單元中的多個計算單元依次連接,且每相鄰兩個計算單元間包括緩沖組件,該組件用于緩存數(shù)據(jù)以及進行兩個計算單元間的數(shù)據(jù)傳輸;其中,多個計算單元采用流式計算架構(gòu)的方式包括:通過每個計算單元模擬一個推理階段,得到該階段的推理結(jié)果,并通過緩沖組件將推理結(jié)果傳輸?shù)脚c該計算單元相鄰的下一目標(biāo)計算單元。

6、在本發(fā)明的一些實施例中,所述緩沖組件包括:用于緩存數(shù)據(jù)包的數(shù)據(jù)包隊列、用于指示目標(biāo)計算單元的忙閑狀態(tài)的狀態(tài)標(biāo)志和用于統(tǒng)計數(shù)據(jù)包數(shù)量的數(shù)據(jù)包計數(shù)器;其中,所述緩沖組件被配置為:根據(jù)狀態(tài)標(biāo)志判斷目標(biāo)計算單元的是否空閑,若是,調(diào)度數(shù)據(jù)包隊列采用先進先出原則將其緩存的數(shù)據(jù)包傳輸至目標(biāo)計算單元,并更新數(shù)據(jù)包數(shù)量,反之,停止數(shù)據(jù)包傳輸。

7、在本發(fā)明的一些實施例中,所述并行度調(diào)度子模塊被配置為:在所述資源占用率小于預(yù)設(shè)閾值的約束下,動態(tài)優(yōu)化計算邏輯子模塊中每個計算單元的并行度,優(yōu)化目標(biāo)是最小化受力計算時間;其中,系統(tǒng)根據(jù)優(yōu)化后的各個計算單元的并行度,調(diào)整每相鄰兩個計算單元間的緩沖組件數(shù)量或緩沖組件中緩存數(shù)據(jù)的容量。

8、在本發(fā)明的一些實施例中,所述系統(tǒng)被配置為利用異構(gòu)加速器采用以下方式計算各原子的運動軌跡:計算各原子在預(yù)定時間內(nèi)的每個時刻的受力,各原子在初始時刻的受力基于其初始位置和初始速度計算得到,各原子之后每個時刻的受力基于其在上一時刻更新的速度和位置計算得到;基于各原子在預(yù)定時間內(nèi)的每個時刻的受力,更新各原子在下一時刻的速度和位置;基于各原子在在預(yù)定時間內(nèi)的所有時刻的位置得到各原子在預(yù)定時間內(nèi)的運動軌跡。

9、在本發(fā)明的一些實施例中,所述多個計算單元包括:鄰居原子過濾單元,用于根據(jù)各個原子的位置篩選有效原子對,提取有效原子對的初始特征,得到初始矩陣,有效原子對表示兩個原子相鄰且符合預(yù)設(shè)篩選條件的原子對;嵌入向量計算單元,用于計算每對原子對的嵌入向量,基于所有原子對的嵌入向量得到嵌入矩陣;描述矩陣計算單元,用于基于所述初始矩陣和所述嵌入矩陣,計算得到原子環(huán)境局部描述矩陣;神經(jīng)網(wǎng)絡(luò)預(yù)測單元,用于基于所述描述矩陣,預(yù)測得到各個原子的勢能;受力計算單元,用于根據(jù)各個原子的勢能計算各個原子的受力。

10、在本發(fā)明的一些實施例中,所述原子管理單元包括:速度計算單元,用于基于原子在每個時刻的受力計算原子在每個時刻的加速度;位移計算單元,用于基于原子在每個時刻的加速度和在上個時刻更新的速度,計算原子在每個時刻到下一時刻的位移;位置更新單元,用于基于原子在每個時刻到下一時刻的位移更新原子在下一時刻的位置。

11、在本發(fā)明的一些實施例中,所述數(shù)據(jù)傳輸模塊被配置為:接收異構(gòu)加速器向內(nèi)存發(fā)起的數(shù)據(jù)訪問請求,并對該請求進行處理,以及基于數(shù)據(jù)回傳機制,接收內(nèi)存根據(jù)該請求返回的數(shù)據(jù)并傳輸?shù)疆悩?gòu)加速器。

12、在本發(fā)明的一些實施例中,所述異構(gòu)加速器的計算過程包括:

13、檢查參與計算的數(shù)據(jù)是否準(zhǔn)備就緒,包括檢查異構(gòu)加速器中是否有待處理的數(shù)據(jù)包;根據(jù)原子管理單元調(diào)度的任務(wù),利用總處理單元的計算單元完成原子的受力計算過程中對應(yīng)的推理階段,得到推理結(jié)果;將推理結(jié)果緩存到緩沖組件中,以傳輸?shù)较乱荒繕?biāo)計算單元;基于事件驅(qū)動機制,調(diào)度受力計算過程的下一任務(wù);判斷下一任務(wù)的調(diào)度是否完成,若未完成,重復(fù)上述過程,反之,輸出計算結(jié)果。

14、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于:

15、首先,本發(fā)明系統(tǒng)實現(xiàn)面向deepmd算法的加速器的專用模擬框架,為后續(xù)高效模擬受力計算過程提供支持。其次,異構(gòu)加速器的計算邏輯子模塊采用流式計算架構(gòu)模擬deepmd模型對原子的受力計算過程,流式計算架構(gòu)使本發(fā)明在受力計算方面,能夠?qū)崿F(xiàn)數(shù)據(jù)的連續(xù)流動式處理,實現(xiàn)實時計算原子的受力,精確得出分子體系內(nèi)各個原子的受力情況,為分子動力學(xué)模擬提供準(zhǔn)確的數(shù)據(jù)支持。最后,通過以最小化受力計算時間為優(yōu)化目標(biāo)來動態(tài)優(yōu)化計算邏輯子模塊的并行度,實現(xiàn)本發(fā)明分子動力學(xué)的特定計算模式下的專用加速器的優(yōu)化。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1