本申請涉及數(shù)據(jù)分區(qū),尤其涉及一種數(shù)據(jù)分區(qū)方法、裝置及相關(guān)產(chǎn)品。
背景技術(shù):
1、隨著科技的不斷發(fā)展,分布式系統(tǒng)主要被用于應用程序中數(shù)據(jù)集的存儲和查詢,其中分布式系統(tǒng)將數(shù)據(jù)集劃分為多個數(shù)據(jù)分區(qū),以通過該數(shù)據(jù)分區(qū)來實現(xiàn)數(shù)據(jù)集的存儲和查詢。在相關(guān)技術(shù)中,大多利用歷史查詢請求來對數(shù)據(jù)集進行分區(qū),歷史查詢請求為查詢數(shù)據(jù)集中數(shù)據(jù)時所執(zhí)行的請求,然而由于新的查詢請求大多可能與歷史查詢請求不同,此時再利用該分區(qū)查詢數(shù)據(jù)集中與新的查詢請求對應的數(shù)據(jù),會導致查詢效率變慢。由此,如何提高查詢效率,已經(jīng)成為當前領(lǐng)域亟待解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、本申請實施例提供了一種數(shù)據(jù)分區(qū)方法、裝置及相關(guān)產(chǎn)品,旨在提高查詢效率。
2、本申請第一方面提供了一種數(shù)據(jù)分區(qū)方法,包括:
3、獲取歷史查詢請求集和數(shù)據(jù)總集,所述數(shù)據(jù)總集包括與所述歷史查詢請求集對應的數(shù)據(jù)子集和其余查詢數(shù)據(jù)子集;
4、根據(jù)所述歷史查詢請求集的查詢時間,獲得所述歷史查詢請求集中的多個歷史查詢請求對,其中目標歷史查詢請求對中第一歷史查詢請求的查詢時間早于所述歷史查詢請求對中第二歷史查詢請求的查詢時間,所述目標歷史查詢請求對為所述多個歷史查詢請求對中的任意一個;
5、對所述多個歷史查詢請求對分別進行計算,獲得所述多個歷史查詢請求對分別對應的相似度,并將所述多個歷史查詢請求對分別對應的相似度中的最大值作為所述歷史查詢請求集的擴展值;
6、根據(jù)所述擴展值對所述歷史查詢請求集中的每個歷史查詢請求分別進行擴展,獲得擴展后的歷史查詢請求集;
7、根據(jù)所述擴展后的歷史查詢請求集對所述數(shù)據(jù)總集進行分區(qū)操作,獲得所述數(shù)據(jù)總集對應的數(shù)據(jù)分區(qū)。
8、本申請第二方面提供了一種數(shù)據(jù)分區(qū)裝置,包括:
9、請求集獲取單元,用于獲取歷史查詢請求集和數(shù)據(jù)總集,所述數(shù)據(jù)總集包括與所述歷史查詢請求集對應的數(shù)據(jù)子集和其余查詢數(shù)據(jù)子集;
10、請求對獲得單元,用于根據(jù)所述歷史查詢請求集的查詢時間,獲得所述歷史查詢請求集中的多個歷史查詢請求對,其中目標歷史查詢請求對中第一歷史查詢請求的查詢時間早于所述歷史查詢請求對中第二歷史查詢請求的查詢時間,所述目標歷史查詢請求對為所述多個歷史查詢請求對中的任意一個;
11、擴展值獲得單元,用于對所述多個歷史查詢請求對分別進行計算,獲得所述多個歷史查詢請求對分別對應的相似度,并將所述多個歷史查詢請求對分別對應的相似度中的最大值作為所述歷史查詢請求集的擴展值;
12、擴展請求集獲得單元,用于根據(jù)所述擴展值對所述歷史查詢請求集中的每個歷史查詢請求分別進行擴展,獲得擴展后的歷史查詢請求集;
13、數(shù)據(jù)總集分區(qū)單元,用于根據(jù)所述擴展后的歷史查詢請求集對所述數(shù)據(jù)總集進行分區(qū)操作,獲得所述數(shù)據(jù)總集對應的數(shù)據(jù)分區(qū)。
14、本申請第三方面提供了一種計算機設備,所述設備包括處理器以及存儲器:
15、所述存儲器用于存儲計算機程序,并將所述計算機程序傳輸給所述處理器;
16、所述處理器用于根據(jù)所述計算機程序中的指令執(zhí)行第一方面提供的數(shù)據(jù)分區(qū)方法的步驟。
17、本申請第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)用于存儲計算機程序,所述計算機程序被計算機設備執(zhí)行時實現(xiàn)第一方面提供的數(shù)據(jù)分區(qū)方法的步驟。
18、本申請第五方面提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被計算機設備執(zhí)行時實現(xiàn)第一方面提供的數(shù)據(jù)分區(qū)方法的步驟。
19、從以上技術(shù)方案可以看出,本申請實施例具有以下優(yōu)點:
20、在本申請技術(shù)方案中首先獲取歷史查詢請求集和數(shù)據(jù)總集,然后根據(jù)歷史查詢請求集的查詢時間,獲得歷史查詢請求集中的多個歷史查詢請求對,需要說明的,目標歷史查詢請求對中第一歷史查詢請求的查詢時間早于歷史查詢請求對中第二歷史查詢請求的查詢時間;在此之后,對多個歷史查詢請求對分別進行計算,獲得多個歷史查詢請求對分別對應的相似度,并將多個歷史查詢請求對分別對應的相似度中的最大值作為歷史查詢請求集的擴展值;最后根據(jù)擴展值對歷史查詢請求集中的每個歷史查詢請求分別進行擴展,獲得擴展后的歷史查詢請求集,以根據(jù)擴展后的歷史查詢請求集對數(shù)據(jù)總集進行分區(qū)操作,獲得數(shù)據(jù)總集對應的數(shù)據(jù)分區(qū)??梢姡诒旧暾堉型ㄟ^查詢請求對中不同查詢時間分別對應的查詢請求來模擬歷史查詢請求和新的查詢請求,并根據(jù)多個查詢請求對中兩者之間相似度的最大值來擴展查詢請求集中的查詢請求,如此,相較于相關(guān)技術(shù),本申請利用擴展后的查詢請求集對數(shù)據(jù)總集進行分區(qū)操作獲得的數(shù)據(jù)分區(qū)來查詢數(shù)據(jù),可以提高查詢效率。
1.一種數(shù)據(jù)分區(qū)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述多個歷史查詢請求對分別進行計算,獲得所述多個歷史查詢請求對分別對應的相似度,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述擴展值對所述歷史查詢請求集中的每個歷史查詢請求分別進行擴展,獲得擴展后的歷史查詢請求集,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述擴展后的歷史查詢請求集對所述數(shù)據(jù)總集進行分區(qū)操作,獲得所述數(shù)據(jù)總集對應的數(shù)據(jù)分區(qū),包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述根據(jù)所述擴展后的歷史查詢請求集,獲得所述數(shù)據(jù)總集中與所述擴展后的歷史查詢請求集對應的數(shù)據(jù)子集之前,還包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述將所述擴展后的歷史查詢請求集對應的數(shù)據(jù)子集劃分為所述數(shù)據(jù)總集中的第一數(shù)據(jù)分區(qū),包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述對所述存在部分重疊的查詢請求對應的數(shù)據(jù)子集進行分區(qū)操作,獲得所述存在部分重疊的查詢請求對應的數(shù)據(jù)子集對應的最小規(guī)則矩形分區(qū)之后,還包括:
8.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述更新后的其余查詢數(shù)據(jù)子集劃分為所述數(shù)據(jù)總集中的第二數(shù)據(jù)分區(qū),包括:
9.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在將所述更新后的其余查詢數(shù)據(jù)子集劃分為所述數(shù)據(jù)總集中的第二數(shù)據(jù)分區(qū)之后,還包括:
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述擴展后的歷史查詢請求集對所述數(shù)據(jù)總集進行分區(qū)操作,獲得所述數(shù)據(jù)總集對應的數(shù)據(jù)分區(qū)之后,還包括:
11.一種數(shù)據(jù)分區(qū)裝置,其特征在于,包括:
12.一種計算機設備,其特征在于,所述設備包括處理器以及存儲器:
13.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)用于存儲計算機程序,所述計算機程序被計算機設備執(zhí)行時實現(xiàn)權(quán)利要求1至10任一項所述的數(shù)據(jù)分區(qū)方法的步驟。
14.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序,該計算機程序被計算機設備執(zhí)行時實現(xiàn)權(quán)利要求1至10任一項所述的數(shù)據(jù)分區(qū)方法的步驟。