最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

惡意論壇的識(shí)別方法及裝置制造方法

文檔序號(hào):8004962閱讀:327來(lái)源:國(guó)知局
惡意論壇的識(shí)別方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種惡意論壇的識(shí)別方法及裝置。該方法包括獲取待訪問(wèn)論壇的論壇名稱和該論壇的版塊名稱;將論壇名稱和版塊名稱分別與預(yù)存關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配;若匹配成功,則識(shí)別該論壇為惡意論壇。通過(guò)本發(fā)明,無(wú)論對(duì)已知的惡意論壇或未知的惡意論壇,均能夠?qū)ζ溥M(jìn)行識(shí)別,克服了現(xiàn)有技術(shù)中只能對(duì)已知的惡意論壇進(jìn)行識(shí)別的缺陷。
【專利說(shuō)明】惡意論壇的識(shí)別方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別是涉及一種惡意論壇的識(shí)別方法及裝置。
【背景技術(shù)】
[0002]惡意論壇是指故意在計(jì)算機(jī)系統(tǒng)上執(zhí)行惡意任務(wù)的病毒、蠕蟲和特洛伊木馬等的非法論壇。這類論壇通常都有一個(gè)共同特點(diǎn),他們通常情況下是以某種頁(yè)面形式讓人們正常瀏覽頁(yè)面內(nèi)容,同時(shí)非法獲取用戶計(jì)算機(jī)中的各種數(shù)據(jù)。現(xiàn)如今,惡意論壇嚴(yán)重地影響用戶的網(wǎng)絡(luò)環(huán)境,所以,對(duì)惡意論壇的識(shí)別也已經(jīng)成為保證網(wǎng)絡(luò)安全的重要工作之一,目前,通常采用如下兩種技術(shù)對(duì)惡意論壇進(jìn)行識(shí)別。
[0003]第一種,在防火墻的內(nèi)存中存儲(chǔ)有惡意論壇的IP (Internet Protocol,網(wǎng)絡(luò)之間互連的協(xié)議)地址以及符合該IP地址的所有URL (Uniform Resource Locator,統(tǒng)一資源定位符)的對(duì)應(yīng)關(guān)系。當(dāng)獲取到用戶訪問(wèn)某論壇的URL請(qǐng)求時(shí),還要獲取該論壇的IP地址,根據(jù)該論壇的IP地址在防火墻內(nèi)存中查找該IP地址對(duì)應(yīng)的所有URL,并將論壇URL與防火墻內(nèi)存中該IP地址對(duì)應(yīng)的所有URL進(jìn)行對(duì)比,對(duì)比成功則說(shuō)明該論壇為惡意論壇。
[0004]第二種,將用戶想要訪問(wèn)的論壇的URL與惡意關(guān)鍵詞列表頁(yè)匹配,在匹配結(jié)果中選取基準(zhǔn)關(guān)鍵字,并對(duì)這組關(guān)鍵字進(jìn)行順序標(biāo)號(hào)標(biāo)識(shí),若該組關(guān)鍵字的順序號(hào)標(biāo)識(shí)數(shù)目與保存的惡意關(guān)鍵詞表中的該組關(guān)鍵字的順序號(hào)標(biāo)識(shí)數(shù)目一致,則說(shuō)明該論壇為惡意論壇。
[0005]上述兩種技術(shù)均為基于URL對(duì)比的方式,這就需要預(yù)先獲取到惡意論壇的URL并存儲(chǔ),因此僅能夠?qū)σ阎膼阂庹搲M(jìn)行識(shí)別和過(guò)濾,對(duì)未知的惡意論壇無(wú)法進(jìn)行識(shí)別和處理。

【發(fā)明內(nèi)容】

[0006]鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的惡意論壇的識(shí)別方法及裝置。
[0007]本發(fā)明提供了一種惡意論壇的識(shí)別方法,包括:
[0008]獲取待訪問(wèn)論壇的論壇名稱和論壇的版塊名稱;
[0009]將論壇名稱和版塊名稱分別與預(yù)存關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配;
[0010]若匹配成功,則識(shí)別論壇為惡意論壇。
[0011]進(jìn)一步地,在識(shí)別論壇為惡意論壇之后,還包括:
[0012]收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表;
[0013]對(duì)論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞添加到關(guān)鍵詞庫(kù)中。
[0014]進(jìn)一步地,對(duì)論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,包括:
[0015]根據(jù)最長(zhǎng)公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對(duì)應(yīng)的熱點(diǎn)詞表;
[0016]根據(jù)詞語(yǔ)出現(xiàn)頻率在各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞;
[0017]將獲取的各個(gè)熱點(diǎn)關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞。
[0018]進(jìn)一步地,各個(gè)熱點(diǎn)詞表的生成方式包括:
[0019]對(duì)于論壇名稱列表和版塊名稱列表而言,
[0020]采用最長(zhǎng)公共子序列LCS算法對(duì)其中包含的每?jī)蓚€(gè)詞進(jìn)行匹配;
[0021]獲取每?jī)蓚€(gè)詞之間的最長(zhǎng)公共子序列,作為熱點(diǎn)關(guān)鍵詞;
[0022]將獲取的所有熱點(diǎn)關(guān)鍵詞進(jìn)行組合,得到與其對(duì)應(yīng)的熱點(diǎn)詞表。
[0023]進(jìn)一步地,根據(jù)詞語(yǔ)出現(xiàn)頻率在各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞,包括:
[0024]根據(jù)預(yù)設(shè)規(guī)則分別對(duì)各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞進(jìn)行篩選;
[0025]在篩選后的各個(gè)熱點(diǎn)詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個(gè)數(shù)熱點(diǎn)關(guān)鍵詞。
[0026]進(jìn)一步地,根據(jù)預(yù)設(shè)規(guī)則分別對(duì)各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞進(jìn)行篩選,包括:
[0027]對(duì)各個(gè)熱點(diǎn)詞表進(jìn)行常用語(yǔ)去除處理,其中,常用語(yǔ)為使用頻率超過(guò)預(yù)設(shè)次數(shù)的詞語(yǔ);
[0028]判斷處理后的各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞所對(duì)應(yīng)的論壇是否為惡意論壇;
[0029]若是,保留該關(guān)鍵詞;
[0030]若否,去除該關(guān)鍵詞。
[0031]進(jìn)一步地,收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,包括:
[0032]收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對(duì)應(yīng)的預(yù)處理庫(kù);
[0033]對(duì)各個(gè)預(yù)處理庫(kù)中、來(lái)自同一網(wǎng)絡(luò)之間互連協(xié)議IP地址的名稱進(jìn)行消重處理。
[0034]進(jìn)一步地,對(duì)論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合,包括:
[0035]每隔預(yù)設(shè)時(shí)間對(duì)論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合。
[0036]進(jìn)一步地,惡意關(guān)鍵詞包括論is名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞;
[0037]將論壇名稱以及版塊名稱分別與預(yù)存關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配,包括:
[0038]將論壇名稱與論壇名稱關(guān)鍵詞匹配,將版塊名稱與版塊名稱關(guān)鍵詞匹配;
[0039]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱與版塊名稱關(guān)鍵詞匹配時(shí),則確認(rèn)匹配成功;
[0040]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功;
[0041]當(dāng)版塊名稱與版塊名稱關(guān)鍵詞匹配,且論壇名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功;
[0042]否則,確認(rèn)匹配失敗,則論壇為非惡意論壇。
[0043]本發(fā)明還提供了一種惡意論壇的識(shí)別裝置,包括:
[0044]存儲(chǔ)器,配置為存儲(chǔ)包含惡意關(guān)鍵詞的關(guān)鍵詞庫(kù);
[0045]用戶輸入接口,配置為接收用戶訪問(wèn)論壇的指示;
[0046]名稱獲取器,配置為獲取待訪問(wèn)論壇的論壇名稱和論壇的版塊名稱;
[0047]名稱匹配器,配置為讀取存儲(chǔ)器和名稱獲取器,將論壇名稱和版塊名稱分別與關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配;
[0048]惡意論壇識(shí)別器,配置為若名稱匹配器確認(rèn)匹配成功,則識(shí)別論壇為惡意論壇。[0049]進(jìn)一步地,上述裝置還包括:
[0050]名稱處理器,配置為收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表;
[0051]聚合生成器,配置為對(duì)名稱處理器得到的論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞存儲(chǔ)到存儲(chǔ)器的關(guān)鍵詞庫(kù)中。
[0052]進(jìn)一步地,聚合生成器包括:
[0053]詞表生成單元,配置為根據(jù)最長(zhǎng)公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對(duì)應(yīng)的熱點(diǎn)詞表;
[0054]選取單元,配置為根據(jù)詞語(yǔ)出現(xiàn)頻率在詞表生成單元生成的各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞;
[0055]合并單元,配置為將選取單元獲取的各個(gè)熱點(diǎn)關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞存儲(chǔ)到存儲(chǔ)器的關(guān)鍵詞庫(kù)中。
[0056]進(jìn)一步地,詞表生成單元還配置為按照如下方式生成各個(gè)熱點(diǎn)詞表:
[0057]對(duì)于論壇名稱列表和版塊名稱列表而言,
[0058]采用最長(zhǎng)公共子序列LCS算法對(duì)其中包含的每?jī)蓚€(gè)詞進(jìn)行匹配;
[0059]獲取每?jī)蓚€(gè)詞之間的最長(zhǎng)公共子序列,作為熱點(diǎn)關(guān)鍵詞;
[0060]將獲取的所有熱點(diǎn)關(guān)鍵詞進(jìn)行組合,得到與其對(duì)應(yīng)的熱點(diǎn)詞表。
[0061]進(jìn)一步地,選取單元配置為按照如下方式在各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞:
[0062]根據(jù)預(yù)設(shè)規(guī)則分別對(duì)詞表生成單元生成的各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞進(jìn)行篩選;
[0063]在篩選后的各個(gè)熱點(diǎn)詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個(gè)數(shù)熱點(diǎn)關(guān)鍵詞。
[0064]進(jìn)一步地,選取單元還配置為按照如下方式對(duì)各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞進(jìn)行篩選:
[0065]對(duì)詞表生成單元生成的各個(gè)熱點(diǎn)詞表進(jìn)行常用語(yǔ)去除處理,其中,常用語(yǔ)為使用頻率超過(guò)預(yù)設(shè)次數(shù)的詞語(yǔ);
[0066]判斷處理后的各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞所對(duì)應(yīng)的論壇是否為惡意論壇;
[0067]若是,保留該關(guān)鍵詞;
[0068]若否,去除該關(guān)鍵詞。
[0069]進(jìn)一步地,名稱處理器配置為:
[0070]收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對(duì)應(yīng)的預(yù)處理庫(kù);
[0071]對(duì)各個(gè)預(yù)處理庫(kù)中、來(lái)自同一網(wǎng)絡(luò)之間互連協(xié)議IP地址的名稱進(jìn)行消重處理,得到論壇名稱列表和版塊名稱列表。
[0072]進(jìn)一步地,聚合生成器還配置為每隔預(yù)設(shè)時(shí)間對(duì)論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞存儲(chǔ)到存儲(chǔ)器的關(guān)鍵詞庫(kù)中。
[0073]進(jìn)一步地,存儲(chǔ)器中的惡意關(guān)鍵詞包括論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞;
[0074]名稱匹配器配置為按照如下方式執(zhí)行匹配操作:
[0075]將論壇名稱與論壇名稱關(guān)鍵詞匹配,將版塊名稱與版塊名稱關(guān)鍵詞匹配;
[0076]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱與版塊名稱關(guān)鍵詞匹配時(shí),則確認(rèn)匹配成功;[0077]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功;
[0078]當(dāng)版塊名稱與版塊名稱關(guān)鍵詞匹配,且論壇名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功;
[0079]否則,確認(rèn)匹配失敗,則論壇為非惡意論壇。
[0080]本發(fā)明提供了一種惡意論壇的識(shí)別方法及裝置,通過(guò)本發(fā)明,使終端能夠識(shí)別出與關(guān)鍵詞庫(kù)中惡意關(guān)鍵詞匹配的論壇為惡意論壇。在每次識(shí)別惡意論壇之后,還會(huì)進(jìn)行熱點(diǎn)聚合生成新惡意關(guān)鍵詞,并將其存入關(guān)鍵詞庫(kù)。新惡意關(guān)鍵詞的添加,豐富了關(guān)鍵詞庫(kù),從而使得本發(fā)明能夠識(shí)別出更多的惡意論壇。
[0081]可見,對(duì)于本發(fā)明,無(wú)論待識(shí)別的論壇為已知論壇還是未知論壇,只要其論壇名稱和版塊名稱能夠與關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞相匹配,就能夠?qū)ζ溥M(jìn)行識(shí)別,克服了現(xiàn)有技術(shù)中只能對(duì)已知的惡意論壇進(jìn)行識(shí)別的缺陷。進(jìn)一步地,現(xiàn)有技術(shù)中,當(dāng)惡意論壇的URL的存儲(chǔ)數(shù)量較大時(shí),會(huì)導(dǎo)致查找效率降低,而本發(fā)明在對(duì)惡意論壇進(jìn)行識(shí)別時(shí),以論壇的論壇名稱和版塊名稱為單位進(jìn)行處理,從而提高了惡意論壇的識(shí)別效率。另外,由于現(xiàn)有技術(shù)中惡意論壇的IP地址經(jīng)常發(fā)生變化,而當(dāng)原IP地址已經(jīng)為正常論壇所用時(shí),就易導(dǎo)致將原IP地址對(duì)應(yīng)的論壇識(shí)別為惡意論壇,而本發(fā)明在識(shí)別惡意論壇時(shí),僅使用論壇名稱和版塊名稱即可,從而能夠有效地避免了誤將正常論壇識(shí)別為惡意論壇。
[0082]上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
[0083]根據(jù)下文結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的詳細(xì)描述,本領(lǐng)域技術(shù)人員將會(huì)更加明了本發(fā)明的上述以及其他目的、優(yōu)點(diǎn)和特征。
【專利附圖】

【附圖說(shuō)明】
[0084]通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0085]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的一種惡意論壇的識(shí)別方法流程圖;
[0086]圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的熱點(diǎn)聚合方法流程圖;
[0087]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的一種惡意論壇的識(shí)別裝置框圖。
【具體實(shí)施方式】
[0088]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0089]相關(guān)技術(shù)提及,在識(shí)別惡意論壇時(shí),均為基于URL對(duì)比的方式來(lái)識(shí)別待訪問(wèn)的論壇是否為惡意論壇,因此,僅能夠?qū)σ阎膼阂庹搲M(jìn)行識(shí)別和處理,對(duì)未知的惡意論壇無(wú)法進(jìn)行識(shí)別和處理。為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供了一種惡意論壇的識(shí)別方法及裝置。
[0090]下面結(jié)合附圖,對(duì)本發(fā)明實(shí)施例提供的一種惡意論壇的識(shí)別方法及裝置進(jìn)行詳細(xì)地說(shuō)明。本發(fā)明實(shí)施例對(duì)具有瀏覽論壇功能的終端進(jìn)行了改進(jìn),例如,本實(shí)施例中的終端可以為PC (Personal Computer,個(gè)人計(jì)算機(jī))、手機(jī)、手持電腦等用戶終端設(shè)備。
[0091]實(shí)施例一
[0092]本實(shí)施例為本發(fā)明的一個(gè)具體應(yīng)用場(chǎng)景,通過(guò)本實(shí)施例,能夠更加清楚、具體地闡述本發(fā)明所提供的方法。
[0093]圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種惡意論壇的識(shí)別方法流程圖。該方法具體包括步驟SlOl至S106。
[0094]S101,獲取用戶待訪問(wèn)論壇的論壇名稱和版塊名稱。
[0095]本實(shí)施例中,論壇名稱和版塊名稱為論壇指示了論壇的所包括的內(nèi)容。開發(fā)者在為論壇名稱命名時(shí),一般情況會(huì)根據(jù)內(nèi)容來(lái)對(duì)其進(jìn)行命名,每個(gè)論壇只有一個(gè)名稱。但是,論壇中的內(nèi)容是以版塊的形式進(jìn)行劃分的,一個(gè)論壇中通常至少要包括一個(gè)版塊,每個(gè)版塊包含了不同話題的內(nèi)容,所以,版塊名稱可以根據(jù)所涉及的話題內(nèi)容來(lái)設(shè)定。例如:名稱為“攝影帝國(guó)”的論壇,其在版塊劃分和命名時(shí),可以按照攝影的場(chǎng)景來(lái)進(jìn)行,如版塊名稱具體可以為“繽紛世界”、“海底世界”等,當(dāng)用戶看到不同的版塊名稱時(shí),就能夠快速地得知其包含的話題,便于用戶選擇自己感興趣的版塊進(jìn)行瀏覽。
[0096]在獲取到該論壇的論壇名稱和版塊名稱之后,執(zhí)行步驟S102。在步驟S102中,將獲取的論壇名稱和版塊名稱分別與預(yù)存關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配,并確認(rèn)是否匹配成功。若確認(rèn)匹配成功,則觸發(fā)步驟S103將該論壇識(shí)別為惡意論壇的操作,若匹配不成功,則觸發(fā)步驟S104將該論壇識(shí)別為非惡意論壇的操作。
[0097]可選地,為了實(shí)現(xiàn)本步驟S102,需要在終端中預(yù)先存儲(chǔ)一個(gè)關(guān)鍵詞庫(kù),該關(guān)鍵詞庫(kù)中包括了已經(jīng)收集的關(guān)于惡意論壇的惡意關(guān)鍵詞。需要說(shuō)明的是,關(guān)鍵詞庫(kù)中包括的惡意關(guān)鍵詞為兩類,其中一類為論壇名稱關(guān)鍵詞,用于與獲取的論壇名稱進(jìn)行匹配,另一類為版塊名稱關(guān)鍵詞,用于與獲取的版塊名稱進(jìn)行匹配。其中,論壇名稱關(guān)鍵詞為與預(yù)先統(tǒng)計(jì)的惡意論壇名稱相關(guān)的詞,版塊名稱關(guān)鍵詞為與預(yù)先統(tǒng)計(jì)的惡意論壇的版塊名稱相關(guān)的詞,關(guān)鍵詞庫(kù)中的論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞以詞組的形式存儲(chǔ)??蛇x地,在本實(shí)施例中,關(guān)鍵詞庫(kù)中每組惡意關(guān)鍵詞的存儲(chǔ)結(jié)構(gòu)如下表一所不。
[0098]表一
[0099]
【權(quán)利要求】
1.一種惡意論壇的識(shí)別方法,包括: 獲取待訪問(wèn)論壇的論壇名稱和所述論壇的版塊名稱; 將所述論壇名稱和所述版塊名稱分別與預(yù)存關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配; 若匹配成功,則識(shí)別所述論壇為惡意論壇。
2.根據(jù)權(quán)利要求1所述的方法,其中,在識(shí)別所述論壇為惡意論壇之后,還包括: 收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表; 對(duì)所述論壇名稱列表和所述版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,將所述新惡意關(guān)鍵詞添加到所述關(guān)鍵詞庫(kù)中。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述對(duì)所述論壇名稱列表和所述版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,包括: 根據(jù)最長(zhǎng)公共子序列LCS算法,生成與所述論壇名稱列表和所述版塊名稱列表各自對(duì)應(yīng)的熱點(diǎn)詞表; 根據(jù)詞語(yǔ)出現(xiàn)頻率在各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞; 將獲取的各個(gè)熱點(diǎn)關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)詞語(yǔ)出現(xiàn)頻率在各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞,包括: 根據(jù)預(yù)設(shè)規(guī)則分別對(duì)各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞進(jìn)行篩選; 在篩選后的各個(gè)熱點(diǎn)詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個(gè)數(shù)熱點(diǎn)關(guān)鍵詞。
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其中,所述惡意關(guān)鍵詞包括論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞; 將所述論壇名稱以及所述版塊名稱分別與預(yù)存關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配,包括: 將所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,將所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配時(shí),則確認(rèn)匹配成功; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功; 當(dāng)所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配,且所述論壇名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功; 否則,確認(rèn)匹配失敗,則所述論壇為非惡意論壇。
6.一種惡意論壇的識(shí)別裝置,包括: 存儲(chǔ)器,配置為存儲(chǔ)包含惡意關(guān)鍵詞的關(guān)鍵詞庫(kù); 用戶輸入接口,配置為接收用戶訪問(wèn)論壇的指示; 名稱獲取器,配置為獲取待訪問(wèn)論壇的論壇名稱和所述論壇的版塊名稱; 名稱匹配器,配置為讀取所述存儲(chǔ)器和所述名稱獲取器,將所述論壇名稱和所述版塊名稱分別與所述關(guān)鍵詞庫(kù)中的惡意關(guān)鍵詞進(jìn)行匹配; 惡意論壇識(shí)別器,配置為若所述名稱匹配器確認(rèn)匹配成功,則識(shí)別所述論壇為惡意論壇。
7.根據(jù)權(quán)利要求6所述的裝置,其中,所述裝置還包括: 名稱處理器,配置為收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表; 聚合生成器,配置為對(duì)所述名稱處理器得到的論壇名稱列表和版塊名稱列表進(jìn)行熱點(diǎn)聚合,得到新惡意關(guān)鍵詞,將所述新惡意關(guān)鍵詞存儲(chǔ)到所述存儲(chǔ)器的關(guān)鍵詞庫(kù)中。
8.根據(jù)權(quán)利要求6或7所述的裝置,其中,所述聚合生成器包括: 詞表生成單元,配置為根據(jù)最長(zhǎng)公共子序列LCS算法,生成與所述論壇名稱列表和所述版塊名稱列表各自對(duì)應(yīng)的熱點(diǎn)詞表; 選取單元,配置為根據(jù)詞語(yǔ)出現(xiàn)頻率在所述詞表生成單元生成的各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞; 合并單元,配置為將所述選取單元獲取的各個(gè)熱點(diǎn)關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞,將所述新惡意關(guān)鍵詞存儲(chǔ)到所述存儲(chǔ)器的關(guān)鍵詞庫(kù)中。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述選取單元配置為按照如下方式在各個(gè)熱點(diǎn)詞表中選擇熱點(diǎn)關(guān)鍵詞: 根據(jù)預(yù)設(shè)規(guī)則分別對(duì)所述詞表生成單元生成的各個(gè)熱點(diǎn)詞表中的熱點(diǎn)關(guān)鍵詞進(jìn)行篩選; 在篩選后的各個(gè)熱點(diǎn)詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個(gè)數(shù)熱點(diǎn)關(guān)鍵詞。
10.根據(jù)權(quán)利要求6至9任一項(xiàng)所述的裝置,其中,所述存儲(chǔ)器中的惡意關(guān)鍵詞包括論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞; 所述名稱匹配器配置為按照如下方式執(zhí)行匹配操作: 將所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,將所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配時(shí),則確認(rèn)匹配成功; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功; 當(dāng)所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配,且所述論壇名稱關(guān)鍵詞為空時(shí),則確認(rèn)匹配成功; 否則,確認(rèn)匹配失敗,則所述論壇為非惡意論壇。
【文檔編號(hào)】H04L29/06GK103475642SQ201310368712
【公開日】2013年12月25日 申請(qǐng)日期:2013年8月22日 優(yōu)先權(quán)日:2013年8月22日
【發(fā)明者】朱珊珊, 林英杰 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1