1.一種基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述架構(gòu)適配層搭建步驟中,為每一所述pytorch算子配置一環(huán)境變量,通過對(duì)環(huán)境變量的配置使pytorch算子調(diào)用默認(rèn)cpu進(jìn)行計(jì)算或調(diào)用神威處理器進(jìn)行計(jì)算。
3.根據(jù)權(quán)利要求2所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述環(huán)境變量的值為0時(shí),調(diào)用pytorch架構(gòu)默認(rèn)的cpu實(shí)現(xiàn),所述環(huán)境變量的值為1時(shí),通過調(diào)用pytorch算子對(duì)應(yīng)的適配接口在神威處理器上執(zhí)行運(yùn)算,以控制算子的執(zhí)行路徑。
4.根據(jù)權(quán)利要求2所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述高性能計(jì)算庫移植步驟進(jìn)一步包括:
5.根據(jù)權(quán)利要求4所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述高性能計(jì)算庫移植步驟進(jìn)一步包括:
6.根據(jù)權(quán)利要求5所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述子任務(wù)執(zhí)行過程中,使用神威處理器的并行編程模型實(shí)現(xiàn)多核之間的通信和同步。
7.根據(jù)權(quán)利要求5所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述高性能計(jì)算庫移植步驟進(jìn)一步包括:
8.根據(jù)權(quán)利要求6所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,還包括:配置一性能計(jì)數(shù)器接口,通過神威平臺(tái)提供的硬件抽象層hal讀取核心性能數(shù)據(jù)。
9.根據(jù)權(quán)利要求1所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述編譯適配步驟中,利用cmake工具修改cmakelists.txt增加交叉編譯配置。
10.根據(jù)權(quán)利要求7所述的基于國產(chǎn)神威處理器的pytorch移植方法,其特征在于,所述張量操作包括轉(zhuǎn)置操作、切片操作、拼接操作。