最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種多模態(tài)樣本共享處理方法與系統(tǒng)與流程

文檔序號:41955448發(fā)布日期:2025-05-16 14:22閱讀:7來源:國知局
一種多模態(tài)樣本共享處理方法與系統(tǒng)與流程

本發(fā)明屬于數(shù)據(jù)處理,尤其涉及一種多模態(tài)樣本共享處理方法與系統(tǒng)。


背景技術(shù):

1、大模型在電力領(lǐng)域的應(yīng)用準(zhǔn)確率難以滿足要求,糾其原因是大模型依賴的多模態(tài)樣本缺乏精準(zhǔn)歸集與共享,難以支撐模型精度提升,同時多模態(tài)樣本缺乏跨模態(tài)協(xié)同標(biāo)注技術(shù)手段,影響模型精度。

2、為解決上述技術(shù)問題,在cn202411110491.5《基于對比學(xué)習(xí)和結(jié)構(gòu)化信息增強多模態(tài)特征融合的方法》中通過在對比學(xué)習(xí)模塊中與文本正樣本和圖片數(shù)據(jù)一起進(jìn)行特征對齊,基于對齊特征送入特征融合模塊進(jìn)行特征融合,提升了訓(xùn)練數(shù)據(jù)的可靠性,但是卻存在以下問題:

3、與其它企業(yè)不同的是,對于圖片、視頻以及文字等多模態(tài)數(shù)據(jù)往往需要從各個縣市公司進(jìn)行聚集共享得到,因此若不能對不同類型的數(shù)據(jù)的進(jìn)行數(shù)據(jù)質(zhì)量檢測,則有可能使得聚集共享得到的無效數(shù)據(jù)的數(shù)據(jù)量較多,不僅數(shù)據(jù)共享過程中的數(shù)據(jù)傳輸?shù)碾y度變大,同時也使得無效數(shù)據(jù)的識別處理的難度進(jìn)一步增大。

4、針對上述技術(shù)問題,本發(fā)明提供了一種多模態(tài)樣本共享處理方法與系統(tǒng)。


技術(shù)實現(xiàn)思路

1、為實現(xiàn)本發(fā)明目的,本發(fā)明采用如下技術(shù)方案:

2、為了解決上述技術(shù)問題,本發(fā)明提供為實現(xiàn)本發(fā)明目的,本發(fā)明采用如下技術(shù)方案:

3、根據(jù)本發(fā)明的一個方面,提供了一種多模態(tài)樣本共享處理方法。

4、一種多模態(tài)樣本共享處理方法,具體包括:

5、s1基于多模態(tài)樣本數(shù)據(jù)的歸集結(jié)果,確定不同模態(tài)的樣本數(shù)據(jù)的變動數(shù)據(jù),并結(jié)合所述樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量的分析結(jié)果確定需要進(jìn)行提前的數(shù)據(jù)質(zhì)量控制時,進(jìn)入下一步驟;

6、s2以不同的樣本數(shù)據(jù)的數(shù)據(jù)來源為基礎(chǔ),將所述樣本數(shù)據(jù)劃分至不同區(qū)域,基于不同區(qū)域中的樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量的分析結(jié)果確定所述區(qū)域的數(shù)據(jù)質(zhì)量評估系數(shù)以及數(shù)據(jù)質(zhì)量偏差區(qū)域;

7、s3將除去所述質(zhì)量偏差區(qū)域外的其它的區(qū)域作為剩余區(qū)域,確定不同的樣本數(shù)據(jù)對應(yīng)的物聯(lián)網(wǎng)監(jiān)測設(shè)備,通過所述剩余區(qū)域的物聯(lián)網(wǎng)監(jiān)測設(shè)備的設(shè)置數(shù)據(jù)與所述數(shù)據(jù)質(zhì)量偏差區(qū)域的相似情況確定所述剩余區(qū)域與所述數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù);

8、s4以所述數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量評估系數(shù)、與所述數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù)為基礎(chǔ),確定所述剩余區(qū)域是否需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制。

9、本發(fā)明的有益效果在于:

10、通過剩余區(qū)域的物聯(lián)網(wǎng)監(jiān)測設(shè)備的設(shè)置數(shù)據(jù)與數(shù)據(jù)質(zhì)量偏差區(qū)域的相似情況確定剩余區(qū)域與數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù),從而實現(xiàn)了從物聯(lián)網(wǎng)監(jiān)測設(shè)備的設(shè)置數(shù)據(jù)確定與數(shù)據(jù)質(zhì)量偏差區(qū)域的相似情況的準(zhǔn)確評估,避免了單一的考慮樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量導(dǎo)致的評估結(jié)果的準(zhǔn)確率不高的技術(shù)問題的出現(xiàn),也為進(jìn)一步從物聯(lián)網(wǎng)監(jiān)測設(shè)備的設(shè)置數(shù)據(jù)與數(shù)據(jù)質(zhì)量偏差區(qū)域的相似情況進(jìn)行需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制的剩余區(qū)域奠定了基礎(chǔ)。

11、基于數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量評估系數(shù)、與數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù),確定剩余區(qū)域是否需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制,不僅考慮到數(shù)據(jù)質(zhì)量偏差區(qū)域與剩余區(qū)域的物聯(lián)網(wǎng)監(jiān)測設(shè)備的相似情況,同時還考慮到不同的數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量情況,實現(xiàn)了從兩個角度進(jìn)行需要進(jìn)行數(shù)量質(zhì)量控制的剩余區(qū)域的確定,也為進(jìn)一步提升樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量奠定了基礎(chǔ)。

12、進(jìn)一步的技術(shù)方案在于,所述多模態(tài)樣本數(shù)據(jù)包括圖像、視頻、文字以及運行數(shù)據(jù)。

13、進(jìn)一步的技術(shù)方案在于,所述樣本數(shù)據(jù)的變動數(shù)據(jù)包括所述樣本數(shù)據(jù)在不同日期的新增數(shù)據(jù)量。

14、進(jìn)一步的技術(shù)方案在于,所述數(shù)據(jù)質(zhì)量的分析結(jié)果包括不同類型的數(shù)據(jù)質(zhì)量缺陷的樣本數(shù)據(jù)的數(shù)據(jù)量以及數(shù)據(jù)量占比。

15、進(jìn)一步的技術(shù)方案在于,確定需要進(jìn)行提前的數(shù)據(jù)質(zhì)量控制,具體包括:

16、以所述樣本數(shù)據(jù)的變動數(shù)據(jù)為基礎(chǔ),確定在不同日期的樣本數(shù)據(jù)的新增數(shù)據(jù)量,通過所述新增數(shù)據(jù)量進(jìn)行新增數(shù)據(jù)量大于預(yù)設(shè)數(shù)據(jù)量的日期的確定,并將其作為數(shù)據(jù)量變動日期;

17、根據(jù)所述樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量的分析結(jié)果,確定所述樣本數(shù)據(jù)在不同日期的質(zhì)量缺陷數(shù)據(jù)的數(shù)據(jù)量占比,并利用所述數(shù)據(jù)量占比進(jìn)行質(zhì)量缺陷偏差日期的確定;

18、基于所述數(shù)據(jù)量變動日期的數(shù)量占比、質(zhì)量缺陷偏差日期的數(shù)量占比確定數(shù)據(jù)質(zhì)量控制需求系數(shù),并通過所述數(shù)據(jù)質(zhì)量控制需求系數(shù)確定是否需要進(jìn)行提前的數(shù)據(jù)質(zhì)量控制。

19、進(jìn)一步的技術(shù)方案在于,當(dāng)所述數(shù)據(jù)質(zhì)量控制需求系數(shù)大于預(yù)設(shè)需求系數(shù)時,則確定需要進(jìn)行提前的數(shù)據(jù)質(zhì)量控制。

20、進(jìn)一步的技術(shù)方案在于,確定所述剩余區(qū)域是否需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制,具體包括:

21、基于所述數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量評估系數(shù)、與所述數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù)的乘積確定不同的數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量相似系數(shù);

22、通過不同的數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量相似系數(shù)的平均值確定所述剩余區(qū)域的數(shù)據(jù)質(zhì)量缺陷概率,并基于所述數(shù)據(jù)質(zhì)量缺陷概率確定所述剩余區(qū)域是否需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制。

23、進(jìn)一步的技術(shù)方案在于,當(dāng)所述數(shù)據(jù)質(zhì)量缺陷概率小于預(yù)設(shè)缺陷概率時,則確定所述剩余區(qū)域不需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制。

24、第二方面,本發(fā)明提供了一種計算機(jī)系統(tǒng),包括:通信連接的存儲器和處理器,以及存儲在所述存儲器上并能夠在所述處理器上運行的計算機(jī)程序,所述處理器運行所述計算機(jī)程序時執(zhí)行上述的一種多模態(tài)樣本共享處理方法。

25、其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點在說明書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

26、為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細(xì)說明如下。



技術(shù)特征:

1.一種多模態(tài)樣本共享處理方法,其特征在于,具體包括:

2.如權(quán)利要求1所述的多模態(tài)樣本共享處理方法,其特征在于,所述多模態(tài)樣本數(shù)據(jù)包括圖像、視頻、文字以及運行數(shù)據(jù)。

3.如權(quán)利要求1所述的多模態(tài)樣本共享處理方法,其特征在于,所述樣本數(shù)據(jù)的變動數(shù)據(jù)包括所述樣本數(shù)據(jù)在不同日期的新增數(shù)據(jù)量。

4.如權(quán)利要求1所述的多模態(tài)樣本共享處理方法,其特征在于,所述數(shù)據(jù)質(zhì)量的分析結(jié)果包括不同類型的數(shù)據(jù)質(zhì)量缺陷的樣本數(shù)據(jù)的數(shù)據(jù)量以及數(shù)據(jù)量占比。

5.如權(quán)利要求1所述的多模態(tài)樣本共享處理方法,其特征在于,確定需要進(jìn)行提前的數(shù)據(jù)質(zhì)量控制,具體包括:

6.如權(quán)利要求5所述的多模態(tài)樣本共享處理方法,其特征在于,所述數(shù)據(jù)質(zhì)量控制需求系數(shù)根據(jù)所述數(shù)據(jù)量變動日期的數(shù)量占比、質(zhì)量缺陷偏差日期的數(shù)量占比的平均值進(jìn)行確定。

7.如權(quán)利要求1所述的多模態(tài)樣本共享處理方法,其特征在于,所述數(shù)據(jù)質(zhì)量控制需求系數(shù)根據(jù)所述數(shù)據(jù)量變動日期的數(shù)量占比、質(zhì)量缺陷偏差日期的數(shù)量占比的最大值進(jìn)行確定。

8.如權(quán)利要求1所述的多模態(tài)樣本共享處理方法,其特征在于,確定所述剩余區(qū)域是否需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制,具體包括:

9.如權(quán)利要求8所述的多模態(tài)樣本共享處理方法,其特征在于,當(dāng)所述數(shù)據(jù)質(zhì)量缺陷概率小于預(yù)設(shè)缺陷概率時,則確定所述剩余區(qū)域不需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制。

10.一種計算機(jī)系統(tǒng),包括:通信連接的存儲器和處理器,以及存儲在所述存儲器上并能夠在所述處理器上運行的計算機(jī)程序,其特征在于,所述處理器運行所述計算機(jī)程序時執(zhí)行權(quán)利要求1-9任一項所述的一種多模態(tài)樣本共享處理方法。


技術(shù)總結(jié)
本發(fā)明提供一種多模態(tài)樣本共享處理方法與系統(tǒng),屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體包括:基于不同區(qū)域中的樣本數(shù)據(jù)的數(shù)據(jù)質(zhì)量的分析結(jié)果確定區(qū)域的數(shù)據(jù)質(zhì)量評估系數(shù)以及數(shù)據(jù)質(zhì)量偏差區(qū)域,將除去質(zhì)量偏差區(qū)域外的其它的區(qū)域作為剩余區(qū)域,確定不同的樣本數(shù)據(jù)對應(yīng)的物聯(lián)網(wǎng)監(jiān)測設(shè)備,通過剩余區(qū)域的物聯(lián)網(wǎng)監(jiān)測設(shè)備的設(shè)置數(shù)據(jù)與數(shù)據(jù)質(zhì)量偏差區(qū)域的相似情況確定剩余區(qū)域與數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù),以數(shù)據(jù)質(zhì)量偏差區(qū)域的數(shù)據(jù)質(zhì)量評估系數(shù)、與數(shù)據(jù)質(zhì)量偏差區(qū)域的設(shè)備設(shè)置相似系數(shù)為基礎(chǔ),確定剩余區(qū)域是否需要在共享前進(jìn)行數(shù)據(jù)質(zhì)量控制,從而提升了數(shù)據(jù)質(zhì)量的可靠性。

技術(shù)研發(fā)人員:朱瑩,王萬欣,張?zhí)m云,胡岸,寧永杰,王晨旭,高爽
受保護(hù)的技術(shù)使用者:國網(wǎng)河南省電力公司信息通信分公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1