本公開涉及金融領域的大數(shù)據(jù),具體涉及一種通用數(shù)據(jù)字典確定方法、裝置、設備、介質和程序產品。
背景技術:
1、隨著多金融數(shù)據(jù)中心的部署,跨金融數(shù)據(jù)中心的交互需求越來越多,網(wǎng)絡流量也呈現(xiàn)快速增長的趨勢,增加了金融數(shù)據(jù)中心的運營和維護成本。為了減輕金融數(shù)據(jù)中心的帶寬壓力,應用其中一個金融數(shù)據(jù)中心的業(yè)務數(shù)據(jù)訓練數(shù)據(jù)字典,并應用該數(shù)據(jù)字典對每一個金融數(shù)據(jù)中心的網(wǎng)絡流量進行壓縮和解壓。
2、在實現(xiàn)本公開構思的過程中,發(fā)明人發(fā)現(xiàn)相關技術中至少存在如下問題,由于每個金融數(shù)據(jù)中心的業(yè)務數(shù)據(jù)分屬于不同的業(yè)務類型,應用同一個數(shù)據(jù)字典對不同的業(yè)務類型的業(yè)務數(shù)據(jù)進行壓縮,導致業(yè)務數(shù)據(jù)的壓縮效果差,而且多個金融數(shù)據(jù)中心之間存在不同的交互需求,應用同一個數(shù)據(jù)字典對接收的其他金融數(shù)據(jù)中心的交互業(yè)務數(shù)據(jù)進行壓縮,也使得業(yè)務數(shù)據(jù)的壓縮效果差,因此,現(xiàn)有技術得到的數(shù)據(jù)字典的普適性差。
技術實現(xiàn)思路
1、鑒于上述問題,本公開提供了一種通用數(shù)據(jù)字典確定方法、裝置、設備、介質和程序產品。
2、根據(jù)本公開的第一個方面,提供了一種通用數(shù)據(jù)字典確方法,包括:獲取每個金融數(shù)據(jù)中心對同一壓縮類型的m個數(shù)據(jù)字典各自的壓縮能力評估結果,得到m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組,其中,上述壓縮能力評估結果表征利用上述數(shù)據(jù)字典對上述金融數(shù)據(jù)中心所包含的業(yè)務類別的業(yè)務數(shù)據(jù)進行壓縮的能力,m個上述數(shù)據(jù)字典與m個上述金融數(shù)據(jù)中心一一對應,每個上述數(shù)據(jù)字典是利用與其對應的上述金融數(shù)據(jù)中心所包含的業(yè)務類別的業(yè)務數(shù)據(jù)進行訓練得到的,m個上述金融數(shù)據(jù)中心各自所包含的業(yè)務類別的業(yè)務數(shù)據(jù)不同;基于m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組,確定m個上述數(shù)據(jù)字典各自的通用壓縮評估結果;基于m個上述數(shù)據(jù)字典各自的通用壓縮評估結果,從m個上述數(shù)據(jù)字典中確定通用數(shù)據(jù)字典,并將上述通用數(shù)據(jù)字典發(fā)送給每個上述金融數(shù)據(jù)中心。
3、根據(jù)本公開的實施例,上述每個上述金融數(shù)據(jù)中心發(fā)送的m個上述數(shù)據(jù)字典各自的壓縮能力評估結果是通過如下方式確定的:在上述金融數(shù)據(jù)中心具備上述數(shù)據(jù)字典的情況下,利用上述數(shù)據(jù)字典對上述金融數(shù)據(jù)中心所存儲的業(yè)務類別的業(yè)務數(shù)據(jù)進行壓縮能力評估,得到初始壓縮能力評估結果;在上述金融數(shù)據(jù)中心不具備上述數(shù)據(jù)字典的情況下,按照預定壓縮能力評估結果作為上述數(shù)據(jù)字典的初始壓縮能力評估結果;對m個上述數(shù)據(jù)字典各自的初始壓縮能力評估結果進行優(yōu)化,得到m個上述數(shù)據(jù)字典各自的上述壓縮能力評估結果。
4、根據(jù)本公開的實施例,上述基于m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組,確定m個上述數(shù)據(jù)字典各自的通用壓縮評估結果,包括:獲取上述數(shù)據(jù)字典用于壓縮m個上述數(shù)據(jù)金融中心各自所包含的業(yè)務類別的業(yè)務數(shù)據(jù)的壓縮比,得到上述數(shù)據(jù)字典的壓縮比組;根據(jù)m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組和壓縮比組,對m個上述數(shù)據(jù)字典各自的通用壓縮能力進行評估,得到m個上述數(shù)據(jù)字典各自的通用壓縮評估結果。
5、根據(jù)本公開的實施例,上述根據(jù)m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組和壓縮比組,對m個上述數(shù)據(jù)字典各自的通用壓縮能力進行評估,得到m個上述數(shù)據(jù)字典各自的通用壓縮評估結果,包括:針對每個上述數(shù)據(jù)字典,計算每個上述數(shù)據(jù)字典針對同一金融數(shù)據(jù)中心的壓縮比和壓縮能力評估結果的乘積,得到上述數(shù)據(jù)字典的針對上述金融數(shù)據(jù)中心的壓縮評估結果;基于針對m個上述金融數(shù)據(jù)中心各自的壓縮評估結果,得到上述數(shù)據(jù)字典的通用壓縮評估結果。
6、根據(jù)本公開的實施例,上述數(shù)據(jù)字典用于壓縮m個上述數(shù)據(jù)金融中心各自所包含的業(yè)務類別的業(yè)務數(shù)據(jù)的壓縮比是通過如下方式確定的:在上述金融數(shù)據(jù)中心具備上述數(shù)據(jù)字典的情況下,利用上述數(shù)據(jù)字典對上述金融數(shù)據(jù)中心所存儲的業(yè)務類別的業(yè)務數(shù)據(jù)進行處理,得到上述數(shù)據(jù)字典的壓縮比;在上述金融數(shù)據(jù)中心不具備上述數(shù)據(jù)字典的情況下,按照預定壓縮比作為上述數(shù)據(jù)字典的壓縮比。
7、根據(jù)本公開的實施例,上述基于m個上述數(shù)據(jù)字典各自的通用壓縮評估結果,從m個上述數(shù)據(jù)字典中確定通用數(shù)據(jù)字典,并將上述通用數(shù)據(jù)字典發(fā)送給每個上述金融數(shù)據(jù)中心,包括:對比同一類型的m個上述數(shù)據(jù)字典各自的通用壓縮評估結果,確定通用壓縮評估結果最高的數(shù)據(jù)字典作為每個上述金融數(shù)據(jù)中心的通用數(shù)據(jù)字典,并將上述通用數(shù)據(jù)字典發(fā)送給每個上述金融數(shù)據(jù)中心。
8、根據(jù)本公開的實施例,每個金融數(shù)據(jù)中心包括不同類型的多個通用數(shù)據(jù)字典;上述通用數(shù)據(jù)字典是通過如下方式進行數(shù)據(jù)壓縮的:確定待壓縮數(shù)據(jù)的壓縮類型;從多個上述通用數(shù)據(jù)字典中確定與上述待壓縮數(shù)據(jù)的壓縮類型相匹配的目標通用數(shù)據(jù)字典;利用上述目標通用數(shù)據(jù)字典對上述待壓縮數(shù)據(jù)進行壓縮。
9、本公開的第二方面提供了一種通用數(shù)據(jù)字典確定裝置,包括:評估結果獲取模塊,用于獲取每個金融數(shù)據(jù)中心對同一壓縮類型的m個數(shù)據(jù)字典各自的壓縮能力評估結果,得到m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組,其中,上述壓縮能力評估結果表征利用上述數(shù)據(jù)字典對上述金融數(shù)據(jù)中心所包含的業(yè)務類別的業(yè)務數(shù)據(jù)進行壓縮的能力,m個上述數(shù)據(jù)字典與m個上述金融數(shù)據(jù)中心一一對應,每個上述數(shù)據(jù)字典是利用與其對應的上述金融數(shù)據(jù)中心所包含的業(yè)務類別的業(yè)務數(shù)據(jù)進行訓練得到的,m個上述金融數(shù)據(jù)中心各自所包含的業(yè)務類別的業(yè)務數(shù)據(jù)不同;通用字典評估模塊,用于基于m個上述數(shù)據(jù)字典各自的壓縮能力評估結果組,確定m個上述數(shù)據(jù)字典各自的通用壓縮評估結果;通用字典確定模塊,用于基于m個上述數(shù)據(jù)字典各自的通用壓縮評估結果,從m個上述數(shù)據(jù)字典中確定通用數(shù)據(jù)字典,并將上述通用數(shù)據(jù)字典發(fā)送給每個上述金融數(shù)據(jù)中心。
10、本公開的第三方面提供了一種電子設備,包括:一個或多個處理器;存儲器,用于存儲一個或多個計算機程序,其中,上述一個或多個處理器執(zhí)行上述一個或多個計算機程序以實現(xiàn)上述方法的步驟。
11、本公開的第四方面還提供了一種計算機可讀存儲介質,其上存儲有計算機程序或指令,上述計算機程序或指令被處理器執(zhí)行時實現(xiàn)上述方法的步驟。
12、本公開的第五方面還提供了一種計算機程序產品,包括計算機程序或指令,上述計算機程序或指令被處理器執(zhí)行時實現(xiàn)上述方法的步驟。
13、根據(jù)本公開的實施例,通過獲取多個金融數(shù)據(jù)中心各自訓練的數(shù)據(jù)字典的壓縮能力評估結果組,將m個數(shù)據(jù)字典各自的壓縮能力進行了量化評估,能夠更客觀的反映各數(shù)據(jù)字典的壓縮能力。然后,基于m個數(shù)據(jù)字典各自的壓縮能力評估結果組,確定m個數(shù)據(jù)字典各自的通用壓縮評估結果,將m個數(shù)據(jù)字典各自的通用壓縮評估結果量化為數(shù)字,減少了主觀因素的干擾,能夠更加客觀的反映每個數(shù)據(jù)字典的通用壓縮能力,m個數(shù)據(jù)字典各自的通用壓縮能力能夠反映每個數(shù)據(jù)字典對所有金融數(shù)據(jù)中心包含的業(yè)務類別的業(yè)務數(shù)據(jù)進行處理的綜合效果以及能力。從m個數(shù)據(jù)字典中確定通用壓縮能力最高的數(shù)據(jù)字典作為通用數(shù)據(jù)字典,使得通用數(shù)據(jù)字典具有更高的普適性。
1.一種通用數(shù)據(jù)字典確定方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述每個所述金融數(shù)據(jù)中心發(fā)送的m個所述數(shù)據(jù)字典各自的壓縮能力評估結果是通過如下方式確定的:
3.根據(jù)權利要求1所述的方法,其特征在于,所述基于m個所述數(shù)據(jù)字典各自的壓縮能力評估結果組,確定m個所述數(shù)據(jù)字典各自的通用壓縮評估結果,包括:
4.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)m個所述數(shù)據(jù)字典各自的壓縮能力評估結果組和壓縮比組,對m個所述數(shù)據(jù)字典各自的通用壓縮能力進行評估,得到m個所述數(shù)據(jù)字典各自的通用壓縮評估結果,包括:
5.根據(jù)權利要求3所述的方法,其特征在于,所述數(shù)據(jù)字典用于壓縮m個所述數(shù)據(jù)金融中心各自所包含的業(yè)務類別的業(yè)務數(shù)據(jù)的壓縮比是通過如下方式確定的:
6.根據(jù)權利要求1所述的方法,其特征在于,所述基于m個所述數(shù)據(jù)字典各自的通用壓縮評估結果,從m個所述數(shù)據(jù)字典中確定通用數(shù)據(jù)字典,并將所述通用數(shù)據(jù)字典發(fā)送給每個所述金融數(shù)據(jù)中心,包括:
7.根據(jù)權利要求1所述的方法,其特征在于,每個金融數(shù)據(jù)中心包括不同類型的多個通用數(shù)據(jù)字典;所述通用數(shù)據(jù)字典是通過如下方式進行數(shù)據(jù)壓縮的:
8.一種通用數(shù)據(jù)字典確定裝置,其特征在于,所述裝置包括:
9.一種電子設備,包括:
10.一種計算機可讀存儲介質,其上存儲有計算機程序或指令,其特征在于,所述計算機程序或指令被處理器執(zhí)行時實現(xiàn)根據(jù)權利要求1~7中任一項所述方法的步驟。
11.一種計算機程序產品,包括計算機程序或指令,其特征在于,所述計算機程序或指令被處理器執(zhí)行時實現(xiàn)根據(jù)權利要求1~7中任一項所述方法的步驟。