最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

互聯(lián)網(wǎng)新聞的評估方法和裝置與流程

文檔序號:12661888閱讀:453來源:國知局
互聯(lián)網(wǎng)新聞的評估方法和裝置與流程
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體而言,涉及一種互聯(lián)網(wǎng)新聞傳播影響力的評估方法和裝置。

背景技術(shù):
當前對互聯(lián)網(wǎng)新聞傳播影響力的評估主要是采用人工統(tǒng)計的方式,主要有以下兩種方式。一、通過從各主流搜索引擎搜索相關(guān)新聞,獲取相關(guān)信息返回結(jié)果數(shù)目,及相關(guān)新聞的網(wǎng)上發(fā)布時間等信息,并進入新聞頁面查看新聞點擊量,轉(zhuǎn)載量,及新聞評論內(nèi)容等信息進行匯總統(tǒng)計。二、通過對各大新聞門戶網(wǎng)站,進行人工梳理網(wǎng)站新聞信息,統(tǒng)計各門戶網(wǎng)站下子欄目里相關(guān)新聞曝光度,信息數(shù)目,內(nèi)容覆蓋率等信息進行粗略研判,評價相關(guān)新聞的影響度?;蛘邔⒍呓Y(jié)合對新聞傳播影響進行綜合評估。人工查詢、手工統(tǒng)計評估新聞傳播影響力方法有以下不足:1、效率低下。當面對互聯(lián)網(wǎng)海量信息時,雖然可以通過搜索引擎工具快速限定信息范圍,但面對搜索引擎返回的數(shù)以千計的相關(guān)信息,由于采用人工查看,手工統(tǒng)計方法,評估數(shù)據(jù)的產(chǎn)出往往較長,同時消耗大量人力物力,評估結(jié)果相對網(wǎng)絡(luò)新聞的時效性相對滯后。2、新聞影響力評估準確性不高。由于對網(wǎng)上新聞數(shù)據(jù)進行檢索評估時會返回大量相關(guān)度較低的數(shù)據(jù)信息,這對新聞影響力評估會造成一定負面影響,干擾影響力評估值的獲取。

技術(shù)實現(xiàn)要素:
本發(fā)明旨在提供一種互聯(lián)網(wǎng)新聞的評估方法和裝置,以實現(xiàn)對互聯(lián)網(wǎng)新聞的評估。在本發(fā)明的實施例中,提供了一種互聯(lián)網(wǎng)新聞的評估方法,包括:獲取設(shè)定網(wǎng)站的頭條新聞的標題;對標題進行分詞聚類處理,以確定其中的熱點;通過搜索引擎獲取熱點所對應(yīng)頭條新聞的內(nèi)容和附屬信息;對所獲取的新聞內(nèi)容和附屬信息進行評估。在本發(fā)明的實施例中,提供了一種互聯(lián)網(wǎng)新聞的評估裝置,包括:獲取模塊,用于獲取設(shè)定網(wǎng)站的頭條新聞的標題;熱點模塊,用于對標題進行分詞聚類處理,以確定其中的熱點;搜索引擎,用于獲取熱點所對應(yīng)頭條新聞的內(nèi)容和附屬信息;評估模塊,對所獲取的新聞內(nèi)容和附屬信息進行評估。本發(fā)明上述實施例的互聯(lián)網(wǎng)新聞的評估方法和裝置因為自動獲取新聞并自動確定其中的熱點和進行評估,所以克服了人工評估效率較低的問題,提高了互聯(lián)網(wǎng)新聞評估的效率和準確性。附圖說明此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中:圖1示出了根據(jù)本發(fā)明實施例的互聯(lián)網(wǎng)新聞的評估方法的流程圖;圖2示出了根據(jù)本發(fā)明實施例的互聯(lián)網(wǎng)新聞的評估裝置的示意圖。具體實施方式下面將參考附圖并結(jié)合實施例,來詳細說明本發(fā)明。圖1示出了根據(jù)本發(fā)明實施例的互聯(lián)網(wǎng)新聞的評估方法的流程圖,包括:步驟S10,獲取設(shè)定網(wǎng)站的頭條新聞的標題,例如,對已經(jīng)限定好的網(wǎng)站進行數(shù)據(jù)檢索,定時獲取各新聞網(wǎng)站欄目的頭條新聞,并將采集回來的新聞標題、鏈接信息,所屬網(wǎng)站、欄目,新聞位序、區(qū)域等相關(guān)信息一并入庫,按不同欄目進行分類存儲管理;步驟S20,對標題進行分詞聚類處理,以確定其中的熱點,例如,對采集回來的頭條新聞的標題進行分詞處理,提取相應(yīng)新聞熱詞,并對返回的新聞信息依據(jù)提取的新聞熱詞進行聚類,最終確定熱點新聞;步驟S30,通過搜索引擎獲取熱點所對應(yīng)頭條新聞的內(nèi)容和附屬信息;步驟S40,對所獲取的新聞內(nèi)容和附屬信息進行評估。可以對采集的新聞信息進行內(nèi)容處理,提取新聞?wù)畔ⅲ侣勱P(guān)鍵詞,并對新聞信息建立索引,以供后期信息分析,展示所用。本方法自動獲取新聞并自動確定其中的熱點和進行評估,所以克服了人工評估效率較低的問題,提高了互聯(lián)網(wǎng)新聞評估的效率和準確性。優(yōu)選地,步驟S20分為如下兩個采集部分:a)、獲取內(nèi)容,該部分采集數(shù)據(jù)主要是為了后期分析評估新聞影響力。采集內(nèi)容如下:新聞發(fā)布時間,新聞信息標題,新聞?wù)?,新聞?wù)膬?nèi)容,該新聞的點擊量,轉(zhuǎn)載量,評論數(shù),及該新聞的新聞評論信息。如果采集的新聞信息已經(jīng)存在,則更新相應(yīng)數(shù)據(jù),以反映信息的最新動態(tài)。b)、獲取附屬信息,該部分采集數(shù)據(jù)主要是為了后期分析新聞傳播影響。采集信息如下:新聞網(wǎng)站,具體發(fā)布欄目,鏈接地址,相關(guān)新聞標題,及相應(yīng)鏈接地址,同時對相關(guān)新聞進行信息采集,采集信息與a)內(nèi)容相同。如果采集的相關(guān)新聞有所變化,則將新增部分進行相應(yīng)處理,以反映信息的最新動態(tài)。優(yōu)選地,步驟S40包括新聞傳播影響力評估,具體包括:評估一條新聞的傳播影響力其中,InfoD1表示該新聞在網(wǎng)站i上的傳播影響力,Wi為網(wǎng)站i的信息影響度權(quán)重。優(yōu)選地,設(shè)置InfoDi=(Sdi+Hdi)Tdi;其中,Sdi表示該新聞在網(wǎng)站i的傳播廣度影響力,Hdi表示該新聞在網(wǎng)站i的新聞熱度影響力,Tdt=e-αt,t表示該新聞的發(fā)布時間至今日的時間距離,α為衰減因子。網(wǎng)絡(luò)上的新聞在發(fā)布之初會吸引大量關(guān)注和評論,但隨著時間推移,單位時間內(nèi)新聞閱讀量和評論數(shù)會越來越少,也就是說無論新聞信息多么吸引人,也會慢慢淡出人們的視線。時間衰減函數(shù)Td=e-αt可以模擬新聞事件衰減過程。時間衰減函數(shù),為表現(xiàn)新聞本身的時效性,這里采用與放射性元素衰減相類似的衰減公式表示新聞時間的時間趨勢。參數(shù)t為新聞持續(xù)時間,即新聞發(fā)布時間至今日的時間距離,α=1為衰減因子,可以根據(jù)用戶的需求進行設(shè)置。將新聞熱度值與新聞傳播廣度值乘以相應(yīng)時間函數(shù),即反應(yīng)新聞事件在該網(wǎng)站的傳播影響度。同理可以獲得該新聞在其他新聞網(wǎng)站的傳播影響度,進而通過計算平均加權(quán)值的方法獲取該新聞在檢索網(wǎng)站范圍內(nèi)的新聞傳播影響力值。優(yōu)選地,本方法還包括:評估Hdi=H1i+H2i;其中,H1i表示該新聞當日在網(wǎng)站i的熱度排行值;H2i表示該新聞前一日在網(wǎng)站i的熱度排行值與當日在網(wǎng)站i的熱度排行值的差值。優(yōu)選地,本方法還包括:評估Sdi=W1i+W2i+W3i;W1i為該新聞在網(wǎng)站i的欄目報道率,即欄目平均覆蓋率;W2i為該新聞在網(wǎng)站i的新聞聚類數(shù)值與該新聞在網(wǎng)站i的數(shù)目比,即新聞內(nèi)容衍生新聞話題率;W3i為該新聞在網(wǎng)站i的回帖數(shù)值與該新聞在網(wǎng)站i的閱讀數(shù)值比,即新聞信息回帖率。優(yōu)選地,可以展示當前各新聞?wù)军c熱點新聞信息,以便用戶對當前網(wǎng)絡(luò)熱點新聞在各新聞?wù)军c的分布做整體了解,可以明確當前熱點新聞在各新聞網(wǎng)站分布情況。也可準確定位新聞具體報道內(nèi)容,并獲取與此新聞相關(guān)的新聞標題信息,方便用戶橫向延展,關(guān)注該新聞衍生出的新的新聞話題。優(yōu)選地,步驟S40包括新聞傳播影響評估,具體包括:通過對所獲取的新聞內(nèi)容中新聞的發(fā)布網(wǎng)站、信息轉(zhuǎn)發(fā)數(shù)量和點擊量評論數(shù),以及附屬信息中新聞網(wǎng)站、具體發(fā)布欄目、鏈接地址、相關(guān)新聞標題和相應(yīng)鏈接地址進行統(tǒng)計,以評估新聞的新聞傳播影響度。其中,獲取的相關(guān)新聞標題對應(yīng)的新聞內(nèi)容中同樣含有如下信息:新聞的發(fā)布網(wǎng)站,信息轉(zhuǎn)發(fā)數(shù)量,點擊量評論數(shù),這些信息同樣可以用于評估新聞傳播影響評估。優(yōu)選地,步驟S40包括新聞持久度評估,具體包括:通過對不同時刻的附屬信息中新聞在網(wǎng)站的分布狀況、信息數(shù)目、及相關(guān)信息轉(zhuǎn)載量、點擊量進行統(tǒng)計,評估新聞的新聞持久度。例如,通過設(shè)定新聞主題,持續(xù)關(guān)注該新聞發(fā)展過程,從新聞事件發(fā)生,到新聞事件持續(xù)發(fā)酵,最終新聞事件終止。通過全程關(guān)注整個新聞事件在不同時期所展現(xiàn)的特性,即通過對不同時刻相關(guān)新聞在網(wǎng)站分布狀況、信息數(shù)目,及相關(guān)信息轉(zhuǎn)載量,點擊量等因素綜合評價新聞事件的持續(xù)影響力。優(yōu)選地,本方法還包括:通過對已經(jīng)獲取的相附屬信息中新聞的發(fā)布網(wǎng)站,轉(zhuǎn)載網(wǎng)站,信息轉(zhuǎn)發(fā)數(shù)量,點擊量,轉(zhuǎn)載量,評論數(shù)進行統(tǒng)計,獲取該新聞的散播途徑、信息擴展范圍、信息受眾等情況;并通過對相應(yīng)的新聞評論進行文本分析,對受眾評論內(nèi)容進行聚類處理,形成信息受眾對該新聞所持的新聞觀點。圖2示出了根據(jù)本發(fā)明實施例的互聯(lián)網(wǎng)新聞的評估裝置的示意圖,包括:獲取模塊10,用于獲取設(shè)定網(wǎng)站的頭條新聞的標題;熱點模塊20,用于對標題進行分詞聚類處理,以確定其中的熱點;搜索引擎30,用于獲取熱點所對應(yīng)頭條新聞的內(nèi)容和附屬信息;評估模塊40,對所獲取的新聞內(nèi)容和附屬信息進行評估。本裝置自動獲取新聞并自動確定其中的熱點和進行評估,所以克服了人工評估效率較低的問題,提高了互聯(lián)網(wǎng)新聞評估的效率和準確性。優(yōu)選地,評估模塊用于評估一條新聞的傳播影響力其中,InfoDi表示該新聞在網(wǎng)站i上的傳播影響力,Wi為網(wǎng)站i的信息影響度權(quán)重,InfoDi=(Sdi+Hdi)Tdi,Sdi表示該新聞在網(wǎng)站i的傳播廣度影響力,Hdi表示該新聞在網(wǎng)站i的新聞熱度影響力,Tdt=e-αt,t表示該新聞的發(fā)布時間至今日的時間距離,α為衰減因子。綜上,通過上述主要信息處理流程可以形成對新聞傳播、影響、新聞事件持久度的初步研判,結(jié)合相應(yīng)圖表等數(shù)據(jù)形式的展現(xiàn)方式,可以較為直觀、便捷地獲取新聞傳播影響力的評估,與傳統(tǒng)人工手動方式統(tǒng)計相比,本發(fā)明大大提高了評估效率。顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1