最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

面向卷積神經(jīng)網(wǎng)絡(luò)的FPGA集群資源調(diào)度方法及系統(tǒng)

文檔序號(hào):41952958發(fā)布日期:2025-05-16 14:15閱讀:來源:國(guó)知局

技術(shù)特征:

1.一種面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,包括下述步驟:

2.根據(jù)權(quán)利要求1所述的面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,步驟s2中對(duì)轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行系數(shù)分析確定每層的所有卷積層重用系數(shù)rf時(shí),確定某一層的卷積層重用系數(shù)rf需要滿足的約束條件為:

3.根據(jù)權(quán)利要求1所述的面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,步驟s3包括:

4.根據(jù)權(quán)利要求3所述的面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,步驟s3.3中的卷積層為二維卷積層conv2d,且給定的卷積層重用系數(shù)rf、推理延遲之間的函數(shù)關(guān)系的函數(shù)表達(dá)式為:

5.根據(jù)權(quán)利要求3所述的面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,步驟s3.3中給定的卷積層重用系數(shù)rf、dsp使用量之間的函數(shù)關(guān)系的函數(shù)表達(dá)式為:

6.?根據(jù)權(quán)利要求1所述的面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,步驟s4中以不改變數(shù)組layer中元素順序的情況下把數(shù)組layer分成k段且滿足每段dsp使用量累加和的最大值最小確定每一段所包含的數(shù)組layer中的元素時(shí),包括采用貪心和二分查找的方法,在范圍內(nèi)通過二分查找不斷逼近dsp使用量累加和最大值最小的情況,其中、分別表示對(duì)數(shù)組layer進(jìn)行的最小值和求和操作;在每次查找中假設(shè)該枚舉值是合理的,然后在每段dsp使用量累加和不超過該值的情況下對(duì)數(shù)組進(jìn)行分段,如果分段數(shù)小于等于k,則說明該值偏大或者正合適,反之則說明枚舉值偏小,最終返回一個(gè)長(zhǎng)度為m的bool類型的數(shù)組,長(zhǎng)度為m的bool類型的數(shù)組中值為true的位置表示卷積神經(jīng)網(wǎng)絡(luò)模型要分區(qū)劃分子模塊的位置。

7.?根據(jù)權(quán)利要求1所述的面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法,其特征在于,步驟s4中為分區(qū)劃分的子模塊之間添加輸入和輸出接口時(shí),包括采用axi4-stream協(xié)議,將子模塊之間的輸入、輸出的并行數(shù)據(jù)流拆分為稱為微包flit的64位自定義位寬流式數(shù)據(jù),并引入了一個(gè)包含“dest”和“l(fā)ast”信號(hào)的側(cè)通道,其中“dest”信號(hào)指示接收數(shù)據(jù)的目標(biāo)fpga地址,而“l(fā)ast”信號(hào)則標(biāo)記完整數(shù)據(jù)包的最后一個(gè)微包flit以確保數(shù)據(jù)傳輸?shù)耐暾院蜏?zhǔn)確性,且子模塊的輸出接口連接有輸出數(shù)據(jù)編碼器用于將并行數(shù)據(jù)流轉(zhuǎn)換為微包flit、子模塊的輸入接口連接有輸入數(shù)據(jù)解碼器用于將微包flit解碼為并行數(shù)據(jù)流。

8.一種面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度系統(tǒng),包括相互連接的微處理器和存儲(chǔ)器,其特征在于,所述微處理器被編程或配置以執(zhí)行權(quán)利要求1~7中任意一項(xiàng)所述面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法。

9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序或指令,其特征在于,該計(jì)算機(jī)程序或指令被編程或配置以通過處理器執(zhí)行權(quán)利要求1~7中任意一項(xiàng)所述面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法。

10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,其特征在于,該計(jì)算機(jī)程序或指令被編程或配置以通過處理器執(zhí)行權(quán)利要求1~7中任意一項(xiàng)所述面向卷積神經(jīng)網(wǎng)絡(luò)的fpga集群資源調(diào)度方法。


技術(shù)總結(jié)
本發(fā)明公開了一種面向卷積神經(jīng)網(wǎng)絡(luò)的FPGA集群資源調(diào)度方法及系統(tǒng),本發(fā)明方法包括將卷積神經(jīng)網(wǎng)絡(luò)模型轉(zhuǎn)換為高層次綜合的代碼,進(jìn)行系數(shù)分析確定每層的所有卷積層重用系數(shù)RF;分別與推理延遲、DSP使用量之間的函數(shù)關(guān)系為每層分配推理延遲以及DSP使用量最優(yōu)的卷積層重用系數(shù)RF;將M層的卷積神經(jīng)網(wǎng)絡(luò)模型中每一層分區(qū)劃分到FPGA集群中的K個(gè)FPGA,為分區(qū)劃分的子模塊之間添加輸入和輸出接口;將分區(qū)劃分的子模塊部署到FPGA集群上。本發(fā)明旨在優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)在FPGA集群上的實(shí)現(xiàn)效率,充分利用FPGA資源使得多個(gè)FPGA高效地合作完成卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算任務(wù)。

技術(shù)研發(fā)人員:黃立波,陸億行,賴明澈,楊凌,趙言亢,黎淵,王強(qiáng),郭輝,王永文
受保護(hù)的技術(shù)使用者:中國(guó)人民解放軍國(guó)防科技大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1