最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于國產(chǎn)神威處理器的pytorch移植方法與流程

文檔序號(hào):41584563發(fā)布日期:2025-04-11 17:34閱讀:來源:國知局

技術(shù)特征:

1.一種基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述架構(gòu)適配層搭建步驟中,為每一所述pytorch算子配置一環(huán)境變量,通過對(duì)環(huán)境變量的配置使pytorch算子調(diào)用默認(rèn)cpu進(jìn)行計(jì)算或調(diào)用神威處理器進(jìn)行計(jì)算。

3.根據(jù)權(quán)利要求2所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述環(huán)境變量的值為0時(shí),調(diào)用pytorch架構(gòu)默認(rèn)的cpu實(shí)現(xiàn),所述環(huán)境變量的值為1時(shí),通過調(diào)用pytorch算子對(duì)應(yīng)的適配接口在神威處理器上執(zhí)行運(yùn)算,以控制算子的執(zhí)行路徑。

4.根據(jù)權(quán)利要求2所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述高性能計(jì)算庫移植步驟進(jìn)一步包括:

5.根據(jù)權(quán)利要求4所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述高性能計(jì)算庫移植步驟進(jìn)一步包括:

6.根據(jù)權(quán)利要求5所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述子任務(wù)執(zhí)行過程中,使用神威處理器的并行編程模型實(shí)現(xiàn)多核之間的通信和同步。

7.根據(jù)權(quán)利要求5所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述高性能計(jì)算庫移植步驟進(jìn)一步包括:

8.根據(jù)權(quán)利要求6所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,還包括:配置一性能計(jì)數(shù)器接口,通過神威平臺(tái)提供的硬件抽象層hal讀取核心性能數(shù)據(jù)。

9.根據(jù)權(quán)利要求1所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述編譯適配步驟中,利用cmake工具修改cmakelists.txt增加交叉編譯配置。

10.根據(jù)權(quán)利要求7所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述張量操作包括轉(zhuǎn)置操作、切片操作、拼接操作。


技術(shù)總結(jié)
本申請(qǐng)涉及人工智能技術(shù)領(lǐng)域,特別是涉及基于國產(chǎn)神威處理器的pytorch移植方法,包括:在pytorch框架和神威處理器之間配置一架構(gòu)適配層swMath,實(shí)現(xiàn)所述多個(gè)適配接口與pytorch框架的pytorch算子一一映射;識(shí)別pytorch框架中的高性能計(jì)算庫,實(shí)現(xiàn)所述高性能計(jì)算庫并基于神威處理器進(jìn)行優(yōu)化,得到優(yōu)化后的高性能計(jì)算庫后,整合為統(tǒng)一的動(dòng)態(tài)鏈接庫并與pytorch框架的libtorch.so庫鏈接;在X86平臺(tái)上使用針對(duì)神威處理器的交叉編譯器sw?gcc和sw?g++編譯C/C++庫文件代碼,生成神威處理器可執(zhí)行文件并在神威處理器上運(yùn)行。通過本申請(qǐng)實(shí)現(xiàn)pytorch框架在神威處理器上的高效運(yùn)行,提升深度學(xué)習(xí)任務(wù)的計(jì)算效率和性能。

技術(shù)研發(fā)人員:叢明明,陳溟,蘇亮,馬猛飛,信子君
受保護(hù)的技術(shù)使用者:青島國實(shí)科技集團(tuán)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/4/10
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1