技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種海量數(shù)據(jù)多維排序搜索方法,包括:根據(jù)數(shù)據(jù)庫中文檔的領(lǐng)域相關(guān)度,將文檔進(jìn)行聚類,得到聚類組織相似查詢樹;將不同的領(lǐng)域的聚類組織進(jìn)行聚類,形成相似查詢樹;獲取用戶提交的查詢向量,將查詢向量表示為查詢超球體;根據(jù)查詢超球體與相似查詢樹中節(jié)點(diǎn)所代表的超球體的位置關(guān)系,獲取與查詢超球體交集最多的超球體,并對(duì)該超球體向下一層節(jié)點(diǎn)尋找,直到葉子節(jié)點(diǎn),并查詢其左右鄰居節(jié)點(diǎn),按照相關(guān)比例返回節(jié)點(diǎn)中k個(gè)最相關(guān)的文檔列表以及文檔向量。在大數(shù)據(jù)的環(huán)境下DIK?MEDOIDS算法具有明顯的優(yōu)勢(shì),提高了數(shù)據(jù)的查詢速度已經(jīng)準(zhǔn)確度。
技術(shù)研發(fā)人員:趙志濱;顧佳良;姚蘭;高福祥
受保護(hù)的技術(shù)使用者:東北大學(xué)
技術(shù)研發(fā)日:2017.05.12
技術(shù)公布日:2017.09.15