本說明書一個或多個實(shí)施例涉及隱私保護(hù),尤其涉及一種基于混洗差分隱私的數(shù)據(jù)查詢方法、系統(tǒng)、電子設(shè)備、計(jì)算機(jī)可讀存儲介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、在基于混洗差分隱私的數(shù)據(jù)查詢場景中,相關(guān)方法通常針對單一查詢獨(dú)立執(zhí)行混洗協(xié)議,用戶端需為每個查詢單獨(dú)生成回答消息并注入噪聲,以保障個體隱私。然而,當(dāng)涉及大規(guī)模連續(xù)區(qū)間查詢時,用戶端需參與所有查詢項(xiàng),導(dǎo)致單個用戶的消息發(fā)送數(shù)量與查詢規(guī)模呈線性增長,尤其在數(shù)據(jù)域較大的情況下,通信開銷急劇上升。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本說明書一個或多個實(shí)施例提供一種基于混洗差分隱私的數(shù)據(jù)查詢方法、系統(tǒng)、電子設(shè)備、計(jì)算機(jī)可讀存儲介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
2、為實(shí)現(xiàn)上述目的,本說明書一個或多個實(shí)施例提供技術(shù)方案如下:
3、根據(jù)本說明書一個或多個實(shí)施例的第一方面,提出了一種基于混洗差分隱私的數(shù)據(jù)查詢系統(tǒng),包括混洗器、分析器和持有私有數(shù)據(jù)的用戶端;
4、所述用戶端,用于獲取策略查詢集,所述策略查詢集為原始查詢集的真子集,所述原始查詢集用于描述所述私有數(shù)據(jù)所在數(shù)據(jù)域中的所有需要回答的區(qū)間查詢,且所述原始查詢集中除所述策略查詢集之外的查詢項(xiàng)的查詢結(jié)果能夠由所述策略查詢集中的至少兩個查詢項(xiàng)的查詢結(jié)果進(jìn)行線性組合得到;基于自身持有的私有數(shù)據(jù)以及差分隱私算法對所述策略查詢集中的各個查詢項(xiàng)進(jìn)行回答,生成所述策略查詢集的回答消息,并發(fā)送給所述混洗器;
5、所述混洗器,用于對所述用戶端發(fā)送的回答消息進(jìn)行匿名化混洗,形成消息隊(duì)列,并將所述消息隊(duì)列發(fā)送給所述分析器;
6、所述分析器,用于基于所述消息隊(duì)列和所述差分隱私算法確定所述策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果;基于所述原始查詢集和所述策略查詢集之間的映射關(guān)系,將所述策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果,轉(zhuǎn)換為所述原始查詢集中的所有查詢項(xiàng)的查詢結(jié)果。
7、根據(jù)本說明書實(shí)施例的第二方面,提供一種基于混洗差分隱私的數(shù)據(jù)查詢方法,應(yīng)用于數(shù)據(jù)查詢系統(tǒng)中的用戶端;所述方法包括:
8、獲取策略查詢集,所述策略查詢集為原始查詢集的真子集,所述原始查詢集用于描述所述用戶端持有的私有數(shù)據(jù)所在數(shù)據(jù)域中的所有需要回答的區(qū)間查詢,且所述原始查詢集中除所述策略查詢集之外的查詢項(xiàng)的查詢結(jié)果能夠由所述策略查詢集中的至少兩個查詢項(xiàng)的查詢結(jié)果進(jìn)行線性組合得到;
9、基于自身持有的私有數(shù)據(jù)以及差分隱私算法對所述策略查詢集中的各個查詢項(xiàng)進(jìn)行回答,生成所述策略查詢集的回答消息,并發(fā)送給所述數(shù)據(jù)查詢系統(tǒng)中的混洗器。
10、根據(jù)本說明書實(shí)施例的第三方面,提供一種基于混洗差分隱私的數(shù)據(jù)查詢方法,應(yīng)用于數(shù)據(jù)查詢系統(tǒng)中的分析器;所述方法包括:
11、接收所述數(shù)據(jù)查詢系統(tǒng)中的混洗器發(fā)送的、針對策略查詢集的消息隊(duì)列;其中,所述策略查詢集為原始查詢集的真子集,所述原始查詢集用于描述所述私有數(shù)據(jù)所在數(shù)據(jù)域中的所有需要回答的區(qū)間查詢,且所述原始查詢集中除所述策略查詢集之外的查詢項(xiàng)的查詢結(jié)果能夠由所述策略查詢集中的至少兩個查詢項(xiàng)的查詢結(jié)果進(jìn)行線性組合得到;
12、基于所述消息隊(duì)列和差分隱私算法確定所述策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果;
13、基于所述原始查詢集和所述策略查詢集之間的映射關(guān)系,將所述策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果,轉(zhuǎn)換為所述原始查詢集中的所有查詢項(xiàng)的查詢結(jié)果。
14、根據(jù)本說明書實(shí)施例的第四方面,提供一種電子設(shè)備,包括:
15、處理器;
16、用于存儲處理器可執(zhí)行指令的存儲器;
17、其中,所述處理器執(zhí)行所述可執(zhí)行指令時,用于實(shí)現(xiàn)第二方面或第三方面所述的方法。
18、根據(jù)本說明書實(shí)施例的第五方面,提供一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時實(shí)現(xiàn)第二方面或第三方面所述方法的步驟。
19、根據(jù)本說明書實(shí)施例的第六方面,提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)第二方面或第三方面所述方法的步驟。
20、本說明書的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
21、本說明書實(shí)施例中,通過策略查詢集,該策略查詢集為原始查詢集的真子集,且原始查詢集中的部分查詢結(jié)果可由策略查詢集中多個查詢結(jié)果的線性組合恢復(fù),從而使得用戶端僅需針對策略查詢集中的各個查詢項(xiàng)作出回答,而無需針對原始查詢集中的各個查詢項(xiàng)作出回答,降低通信開銷;通過引入混洗技術(shù)和差分隱私算法,實(shí)現(xiàn)對用戶回答消息的匿名化處理和噪聲控制,從而確保整體數(shù)據(jù)查詢過程滿足隱私保護(hù)要求;分析器在獲得策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果之后,通過原始查詢集與策略查詢集之間的映射關(guān)系,可以從策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果恢復(fù)出完整的原始查詢答案。
22、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本說明書。
1.一種基于混洗差分隱私的數(shù)據(jù)查詢系統(tǒng),包括混洗器、分析器和持有私有數(shù)據(jù)的用戶端;
2.根據(jù)權(quán)利要求1所述的系統(tǒng),所述策略查詢集中的不同查詢項(xiàng)對應(yīng)不同的查詢標(biāo)識;
3.根據(jù)權(quán)利要求2所述的系統(tǒng),對于任一查詢項(xiàng)對應(yīng)的噪聲消息,所述用戶端遵循以該查詢項(xiàng)對應(yīng)的噪聲發(fā)送概率為參數(shù)的伯努利分布:當(dāng)且僅當(dāng)伯努利試驗(yàn)結(jié)果為1時,生成該查詢項(xiàng)對應(yīng)的噪聲消息。
4.根據(jù)權(quán)利要求2所述的系統(tǒng),所述分析器,具體用于基于接收到的所述消息隊(duì)列中的各個消息攜帶的查詢標(biāo)識,對所述消息隊(duì)列中的消息進(jìn)行分類和統(tǒng)計(jì),得到所述策略查詢集中的各個查詢項(xiàng)的消息數(shù)量;基于各個所述查詢項(xiàng)對應(yīng)的噪聲發(fā)送概率對各個所述查詢項(xiàng)的消息數(shù)量進(jìn)行去噪處理,得到各個所述查詢項(xiàng)的查詢結(jié)果。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),所述分析器,具體用于對于各個所述查詢項(xiàng),基于所述查詢項(xiàng)對應(yīng)的噪聲發(fā)送概率和用戶端總數(shù)量,確定所述查詢項(xiàng)對應(yīng)的噪聲消息預(yù)估數(shù)量,并利用所述查詢項(xiàng)對應(yīng)的噪聲消息預(yù)估數(shù)量對所述查詢項(xiàng)的消息數(shù)量進(jìn)行去噪處理,得到所述查詢項(xiàng)的查詢結(jié)果。
6.根據(jù)權(quán)利要求2~5任意一項(xiàng)所述的系統(tǒng),所述查詢項(xiàng)對應(yīng)的噪聲發(fā)送概率通過以下方式確定:
7.根據(jù)權(quán)利要求6所述的系統(tǒng),所述策略查詢集以策略矩陣表示,所述策略矩陣中的一行用于描述一個查詢項(xiàng);
8.根據(jù)權(quán)利要求1所述的系統(tǒng),所述策略查詢集通過以下方式生成:
9.根據(jù)權(quán)利要求1所述的系統(tǒng),所述策略查詢集以策略矩陣表示,所述原始查詢集以原始矩陣表示,所述策略矩陣和所述原始矩陣中的一行用于描述一個查詢項(xiàng);所述策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果以第一結(jié)果矩陣表示,所述第一結(jié)果矩陣中的行與所述策略矩陣中的行一一對應(yīng);
10.根據(jù)權(quán)利要求9所述的系統(tǒng),所述第二結(jié)果矩陣為所述原始矩陣、所述策略矩陣的逆矩陣以及所述第一結(jié)果矩陣三者的乘積。
11.一種基于混洗差分隱私的數(shù)據(jù)查詢方法,應(yīng)用于數(shù)據(jù)查詢系統(tǒng)中的用戶端;所述方法包括:
12.根據(jù)權(quán)利要求11所述的方法,所述策略查詢集中的不同查詢項(xiàng)對應(yīng)不同的查詢標(biāo)識;
13.根據(jù)權(quán)利要求12所述的方法,對于任一查詢項(xiàng)對應(yīng)的噪聲消息,所述用戶端遵循以該查詢項(xiàng)對應(yīng)的噪聲發(fā)送概率為參數(shù)的伯努利分布:當(dāng)且僅當(dāng)伯努利試驗(yàn)結(jié)果為1時,生成該查詢項(xiàng)對應(yīng)的噪聲消息。
14.一種基于混洗差分隱私的數(shù)據(jù)查詢方法,應(yīng)用于數(shù)據(jù)查詢系統(tǒng)中的分析器;所述方法包括:
15.根據(jù)權(quán)利要求14所述的方法,所述策略查詢集中的不同查詢項(xiàng)對應(yīng)不同的查詢標(biāo)識;
16.根據(jù)權(quán)利要求15所述的方法,所述基于各個所述查詢項(xiàng)對應(yīng)的噪聲發(fā)送概率對各個所述查詢項(xiàng)的消息數(shù)量進(jìn)行去噪處理,得到各個所述查詢項(xiàng)的查詢結(jié)果,包括:
17.根據(jù)權(quán)利要求14所述的方法,所述策略查詢集以策略矩陣表示,所述原始查詢集以原始矩陣表示,所述策略矩陣和所述原始矩陣中的一行用于描述一個查詢項(xiàng);所述策略查詢集中的所有查詢項(xiàng)的查詢結(jié)果以第一結(jié)果矩陣表示,所述第一結(jié)果矩陣中的行與所述策略矩陣中的行一一對應(yīng);
18.根據(jù)權(quán)利要求17所述的方法,所述第二結(jié)果矩陣為所述原始矩陣、所述策略矩陣的逆矩陣以及所述第一結(jié)果矩陣三者的乘積。
19.一種電子設(shè)備,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器通過運(yùn)行所述可執(zhí)行指令以實(shí)現(xiàn)如權(quán)利要求11~18中任一項(xiàng)所述方法的步驟。
20.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)指令,該指令被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求11~18中任一項(xiàng)所述方法的步驟。
21.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求11~18中任一項(xiàng)所述方法的步驟。