本公開的各實現(xiàn)方式涉及計算機領(lǐng)域,特別地涉及用于管理數(shù)據(jù)項的方法、裝置、設(shè)備和計算機可讀存儲介質(zhì)。
背景技術(shù):
1、在計算機系統(tǒng)中,可以存儲多種類型的數(shù)據(jù)項,并且不同類型的數(shù)據(jù)項之間可能會存在復(fù)雜的映射關(guān)系??梢灶A(yù)先存儲這些映射關(guān)系,并且在需要執(zhí)行數(shù)據(jù)轉(zhuǎn)換時,調(diào)用該映射關(guān)系從而將一個類型的數(shù)據(jù)項轉(zhuǎn)換至另一類型。然而,映射關(guān)系通常較為復(fù)雜,這導(dǎo)致存儲映射關(guān)系將會占用大量空間。進一步,轉(zhuǎn)換過程可能會涉及復(fù)雜的算法,這導(dǎo)致轉(zhuǎn)換效率低下。此時,期望可以以更為方便并且有效的方式來管理數(shù)據(jù)項,進而實現(xiàn)在不同類型的數(shù)據(jù)項之間的轉(zhuǎn)換過程。
技術(shù)實現(xiàn)思路
1、在本公開的第一方面,提供了一種用于管理數(shù)據(jù)項的方法。該方法包括:獲取包括多個第一數(shù)據(jù)項的第一數(shù)據(jù)序列和包括多個第二數(shù)據(jù)項的第二數(shù)據(jù)序列;基于第一數(shù)據(jù)序列和第二數(shù)據(jù)序列,將第一數(shù)據(jù)序列劃分為至少一個子序列,至少一個子序列中的目標子序列中的一組第一數(shù)據(jù)項的編碼是連續(xù)的;確定至少一個子序列的映射特征,目標子序列的目標映射特征包括:目標子序列中的一組第一數(shù)據(jù)項的第一邊界和第二邊界、以及目標子序列中的數(shù)據(jù)項的編碼以及第二數(shù)據(jù)序列中的對應(yīng)于數(shù)據(jù)項的另一數(shù)據(jù)項的編碼之間的差異;以及基于至少一個子序列的映射特征,將多個第一數(shù)據(jù)項中的第一數(shù)據(jù)項映射至多個第二數(shù)據(jù)項中的第二數(shù)據(jù)項。
2、在本公開的第二方面,提供了一種用于管理數(shù)據(jù)項的裝置。該裝置包括:序列獲取模塊,被配置為獲取包括多個第一數(shù)據(jù)項的第一數(shù)據(jù)序列和包括多個第二數(shù)據(jù)項的第二數(shù)據(jù)序列;序列劃分模塊,被配置為基于第一數(shù)據(jù)序列和第二數(shù)據(jù)序列,將第一數(shù)據(jù)序列劃分為至少一個子序列,至少一個子序列中的目標子序列中的一組第一數(shù)據(jù)項的編碼是連續(xù)的;特征確定模塊,被配置為確定至少一個子序列的映射特征,目標子序列的目標映射特征包括:目標子序列中的一組第一數(shù)據(jù)項的第一邊界和第二邊界、以及目標子序列中的數(shù)據(jù)項的編碼以及第二數(shù)據(jù)序列中的對應(yīng)于數(shù)據(jù)項的另一數(shù)據(jù)項的編碼之間的差異;以及數(shù)據(jù)映射模塊,被配置為基于至少一個子序列的映射特征,將多個第一數(shù)據(jù)項中的第一數(shù)據(jù)項映射至多個第二數(shù)據(jù)項中的第二數(shù)據(jù)項。
3、在本公開的第三方面,提供了一種電子設(shè)備。該電子設(shè)備包括:至少一個處理單元;以及至少一個存儲器,至少一個存儲器被耦合到至少一個處理單元并且存儲用于由至少一個處理單元執(zhí)行的指令,指令在由至少一個處理單元執(zhí)行時使電子設(shè)備執(zhí)行根據(jù)本公開第一方面的方法。
4、在本公開的第四方面,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,計算機程序在被處理器執(zhí)行時使處理器實現(xiàn)根據(jù)本公開第一方面的方法。
5、應(yīng)當理解,本內(nèi)容部分中所描述的內(nèi)容并非旨在限定本公開的實現(xiàn)方式的關(guān)鍵特征或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的描述而變得容易理解。
1.一種用于管理數(shù)據(jù)項的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中將所述第一數(shù)據(jù)序列劃分為所述至少一個子序列包括:
3.根據(jù)權(quán)利要求2所述的方法,其中基于所述配對序列來確定所述至少一個子序列包括:
4.根據(jù)權(quán)利要求3所述的方法,其中確定所述當前子序列包括:
5.根據(jù)權(quán)利要求4所述的方法,進一步包括:
6.根據(jù)權(quán)利要求5所述的方法,進一步包括:
7.根據(jù)權(quán)利要求5所述的方法,進一步包括:響應(yīng)于確定所述當前映射特征的第一邊界與所述當前配對中的第一數(shù)據(jù)項的編碼是連續(xù),將所述當前映射的第一邊界更新至所述當前配對中的第一數(shù)據(jù)項的編碼。
8.根據(jù)權(quán)利要求5所述的方法,其中將所述當前配對設(shè)置為所述配對序列中的所述當前配對之后的后續(xù)配對包括:響應(yīng)于確定所述當前配對不是所述配對序列中的最后配對,將所述當前配對設(shè)置為所述配對序列中的所述當前配對之后的后續(xù)配對。
9.根據(jù)權(quán)利要求1所述的方法,其中基于所述至少一個子序列的映射特征來將所述多個第一數(shù)據(jù)項中的第一數(shù)據(jù)項映射至所述多個第二數(shù)據(jù)項中的第二數(shù)據(jù)項包括:
10.根據(jù)權(quán)利要求9所述的方法,其中在所述至少一個映射特征中確定對應(yīng)于所述目標數(shù)據(jù)項的目標映射特征包括:基于二分法來在所述至少一個映射特征中確定所述目標映射特征。
11.根據(jù)權(quán)利要求9所述的方法,進一步包括:響應(yīng)于確定不存在對應(yīng)于所述目標數(shù)據(jù)項的映射特征,提供所述目標數(shù)據(jù)項不屬于所述第一子序列的指示。
12.根據(jù)權(quán)利要求1所述的方法,其中所述多個第一數(shù)據(jù)項和所述多個第二數(shù)據(jù)項包括多語言環(huán)境下的字符集中的多個字符,其中所述編碼包括通用字符編碼。
13.根據(jù)權(quán)利要求12所述的方法,其中所述多個第一數(shù)據(jù)項包括大寫字符和小寫字符中的任一項,并且所述多個第二數(shù)據(jù)項包括所述大寫字符和所述小寫字符中的另一項。
14.根據(jù)權(quán)利要求1所述的方法,其中所述多個第一數(shù)據(jù)項和所述多個第二數(shù)據(jù)項按照所述多個第一數(shù)據(jù)項和所述多個第二數(shù)據(jù)項的編碼的順序來排列,所述第一邊界包括上邊界和下邊界中的任一項,并且所述第二邊界包括所述上邊界和所述下邊界中的另一項。
15.一種用于管理數(shù)據(jù)項的裝置,包括:
16.一種電子設(shè)備,包括:
17.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序在被處理器執(zhí)行時使所述處理器實現(xiàn)根據(jù)權(quán)利要求1至14中任一項所述的方法。