本申請涉及高性能計(jì)算,尤其涉及一種高性能計(jì)算網(wǎng)絡(luò)的配置方法及裝置、電子設(shè)備、存儲介質(zhì)、計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、近年來,隨著人工智能和高性能計(jì)算(high?performance?computing,簡稱為hpc)領(lǐng)域的迅猛發(fā)展,跨服務(wù)器節(jié)點(diǎn)間數(shù)據(jù)交換的需求顯著增長,尤其是在訓(xùn)練大規(guī)模機(jī)器學(xué)習(xí)模型時(shí),對網(wǎng)絡(luò)的延遲和吞吐量提出了前所未有的高要求。傳統(tǒng)的以太網(wǎng)技術(shù)在應(yīng)對這些需求時(shí)顯得力不從心,尤其是當(dāng)數(shù)據(jù)量巨大時(shí),網(wǎng)絡(luò)成為系統(tǒng)性能的瓶頸。為了解決這一問題,遠(yuǎn)程直接內(nèi)存訪問(remote?direct?memory?access,簡稱為rdma)技術(shù)應(yīng)運(yùn)而生,其高效的數(shù)據(jù)傳輸能力使得服務(wù)器之間的數(shù)據(jù)交換延遲大大降低,吞吐量顯著提升。高性能計(jì)算網(wǎng)絡(luò)(例如infiniband網(wǎng)絡(luò))作為rdma技術(shù)的一種具體實(shí)現(xiàn),因其極低的延遲和高數(shù)據(jù)傳輸速率,成為了hpc和人工智能應(yīng)用中連接服務(wù)器、存儲系統(tǒng)和網(wǎng)絡(luò)設(shè)備的理想選擇。
2、然而,隨著智算中心的興起,高性能計(jì)算網(wǎng)絡(luò)的管理和配置面臨新的挑戰(zhàn)。為了滿足多租戶場景下對高性能計(jì)算網(wǎng)絡(luò)的需求,云平臺需要能夠支持自動化、隔離的網(wǎng)絡(luò)配置。傳統(tǒng)的高性能計(jì)算網(wǎng)絡(luò)配置方法依賴于手動操作,不僅效率低下,而且在多租戶環(huán)境下難以實(shí)現(xiàn)資源的有效隔離和快速分配。
3、針對相關(guān)技術(shù)中,傳統(tǒng)的高性能計(jì)算網(wǎng)絡(luò)配置方法依賴于手動操作,導(dǎo)致配置效率較低的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本申請?zhí)峁┝艘环N高性能計(jì)算網(wǎng)絡(luò)的配置方法及裝置、電子設(shè)備、存儲介質(zhì)、計(jì)算機(jī)程序產(chǎn)品,以至少解決相關(guān)技術(shù)中傳統(tǒng)的高性能計(jì)算網(wǎng)絡(luò)配置方法依賴于手動操作,導(dǎo)致配置效率較低的問題。
2、本申請?zhí)峁┝艘环N高性能計(jì)算網(wǎng)絡(luò)的配置方法,包括:獲取高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)配置信息;通過高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)管理模塊向高性能計(jì)算網(wǎng)絡(luò)的子網(wǎng)管理器發(fā)送網(wǎng)絡(luò)配置信息,以使得子網(wǎng)管理器根據(jù)網(wǎng)絡(luò)配置信息對高性能計(jì)算網(wǎng)絡(luò)進(jìn)行配置。
3、本申請還提供了一種高性能計(jì)算網(wǎng)絡(luò)的配置裝置,包括:獲取模塊,用于獲取高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)配置信息;配置模塊,用于通過高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)管理模塊向高性能計(jì)算網(wǎng)絡(luò)的子網(wǎng)管理器發(fā)送網(wǎng)絡(luò)配置信息,以使得子網(wǎng)管理器根據(jù)網(wǎng)絡(luò)配置信息對高性能計(jì)算網(wǎng)絡(luò)進(jìn)行配置。
4、本申請還提供了一種電子設(shè)備,包括:存儲器,用于存儲計(jì)算機(jī)程序;處理器,用于執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述任一種高性能計(jì)算網(wǎng)絡(luò)的配置方法的步驟。
5、本申請還提供了一種計(jì)算機(jī)可讀存儲介質(zhì),計(jì)算機(jī)可讀存儲介質(zhì)中存儲有計(jì)算機(jī)程序,其中,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一種高性能計(jì)算網(wǎng)絡(luò)的配置方法的步驟。
6、本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一種高性能計(jì)算網(wǎng)絡(luò)的配置方法的步驟。
7、通過本申請,由于通過網(wǎng)絡(luò)管理模塊向子網(wǎng)管理器發(fā)送網(wǎng)絡(luò)配置信息的方式來對高性能計(jì)算網(wǎng)絡(luò)進(jìn)行配置,進(jìn)而實(shí)現(xiàn)了對高性能計(jì)算網(wǎng)絡(luò)的自動化配置,提高了配置效率,解決了傳統(tǒng)的高性能計(jì)算網(wǎng)絡(luò)配置方法依賴于手動操作,導(dǎo)致配置效率較低的問題。
1.一種高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,獲取高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)配置信息,包括:
3.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)管理模塊向所述高性能計(jì)算網(wǎng)絡(luò)的子網(wǎng)管理器發(fā)送所述網(wǎng)絡(luò)配置信息之前,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)管理模塊向所述高性能計(jì)算網(wǎng)絡(luò)的子網(wǎng)管理器發(fā)送所述網(wǎng)絡(luò)配置信息的過程中,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)管理模塊向所述高性能計(jì)算網(wǎng)絡(luò)的子網(wǎng)管理器發(fā)送所述網(wǎng)絡(luò)配置信息,包括:
6.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,所述方法還包括:
8.根據(jù)權(quán)利要求6或7所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,所述方法還包括:
9.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,在所述高性能計(jì)算網(wǎng)絡(luò)具有n個(gè)分區(qū)的情況下,所述n個(gè)分區(qū)中的每個(gè)分區(qū)在云平臺中對應(yīng)一個(gè)網(wǎng)絡(luò)服務(wù),所述網(wǎng)絡(luò)管理模塊位于所述云平臺中。
10.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,所述方法還包括:
11.根據(jù)權(quán)利要求10所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過網(wǎng)絡(luò)配置模塊對所述目標(biāo)云主機(jī)進(jìn)行調(diào)度,包括:
12.根據(jù)權(quán)利要求11所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述網(wǎng)絡(luò)配置模塊為所述目標(biāo)云主機(jī)調(diào)度一個(gè)虛擬網(wǎng)卡,包括:
13.根據(jù)權(quán)利要求11所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述網(wǎng)絡(luò)配置模塊將所述虛擬網(wǎng)卡的網(wǎng)卡信息關(guān)聯(lián)至所述目標(biāo)分區(qū)標(biāo)識對應(yīng)的分區(qū),包括:
14.根據(jù)權(quán)利要求13所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述網(wǎng)絡(luò)管理模塊將所述虛擬網(wǎng)卡對應(yīng)的端口全局唯一標(biāo)識符關(guān)聯(lián)至所述目標(biāo)分區(qū)標(biāo)識對應(yīng)的分區(qū),包括:
15.根據(jù)權(quán)利要求10所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過網(wǎng)絡(luò)配置模塊對所述目標(biāo)云主機(jī)進(jìn)行調(diào)度,以使得所述目標(biāo)云主機(jī)運(yùn)行在所述目標(biāo)分區(qū)標(biāo)識對應(yīng)的網(wǎng)絡(luò)環(huán)境之后,所述方法還包括:
16.根據(jù)權(quán)利要求1所述的高性能計(jì)算網(wǎng)絡(luò)的配置方法,其特征在于,通過所述高性能計(jì)算網(wǎng)絡(luò)的網(wǎng)絡(luò)管理模塊向所述高性能計(jì)算網(wǎng)絡(luò)的子網(wǎng)管理器發(fā)送所述網(wǎng)絡(luò)配置信息,包括:
17.一種高性能計(jì)算網(wǎng)絡(luò)的配置裝置,其特征在于,包括:
18.一種電子設(shè)備,其特征在于,包括:
19.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)中存儲有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至16任一項(xiàng)所述高性能計(jì)算網(wǎng)絡(luò)的配置方法的步驟。
20.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至16任一項(xiàng)所述高性能計(jì)算網(wǎng)絡(luò)的配置方法的步驟。