本發(fā)明涉及計算機網(wǎng)絡數(shù)據(jù)技術領域,特別是一種用戶偏好分析方法及系統(tǒng)。
背景技術:
隨著技術的不斷發(fā)展,網(wǎng)絡社交逐漸成為了一種新的社交方式,網(wǎng)絡社交從最初的電子郵件發(fā)展到現(xiàn)在的各種社交網(wǎng)站(sns,socialnetworksites),如購物、交友網(wǎng)站。通常情況下,社交網(wǎng)站需要用戶在相應的網(wǎng)站上進行申請注冊,并填寫相關的個人信息,從而獲取個人賬號。當用戶登錄社交網(wǎng)站時,個人賬號及相關信息便成為網(wǎng)站或者他人識別用戶身份的主要標識。
在某些社交網(wǎng)站中,為了更好的推廣網(wǎng)站信息,例如購物類網(wǎng)站的賣家對商品進行推廣,通常會在某一賣家的商品頁面內對其他商品進行推薦展示。而此類推薦展示信息通常結合用戶所感興趣的內容推薦,則能大大提高用戶的使用體驗。因此亟需設計一種用戶偏好分析方法及系統(tǒng)。
技術實現(xiàn)要素:
針對現(xiàn)有技術存在的上述問題,本發(fā)明的目的在于提供一種用戶偏好分析方法及系統(tǒng)。
本發(fā)明提供了一種用戶偏好分析方法,包括以下步驟:
基于用戶的訪問行為獲取所述用戶訪問的初始信息;
對所述初始信息中所述用戶所涉及的網(wǎng)絡內容進行分類處理,得到內容信息;
對初始信息中所述用戶所涉及的用戶瀏覽頻次進行整理,得到頻次信息;
根據(jù)所述內容信息和頻次信息對所述用戶的偏好進行評分,得出所述用戶的偏好信息。
優(yōu)選地,所述基于用戶的訪問行為獲取所述用戶訪問的初始信息包括:
根據(jù)所述用戶的訪問行為從服務器中得到所述用戶訪問的基礎數(shù)據(jù);
根據(jù)所述基礎數(shù)據(jù)獲取所述用戶訪問的業(yè)務內容,并根據(jù)所述基礎數(shù)據(jù)的增加,對所述業(yè)務內容進行擴展,生成所述初始信息。
優(yōu)選地,所述對所述初始信息中用戶所涉及的網(wǎng)絡內容進行分類處理包括:
基于用戶的訪問行為獲取所述用戶訪問的初始信息;
判斷所述初始信息中每一業(yè)務內容是否具有預設的第一分類規(guī)則,并得一判斷結果;
對所述判斷結果為具有所述第一分類規(guī)則的業(yè)務內容,按照所述第一分類規(guī)則對所述業(yè)務內容進行分類;
對所述判斷結果為不具有所述第一分類規(guī)則的業(yè)務內容,按照第二分類規(guī)則對所述業(yè)務內容進行分類;
根據(jù)所述內容信息和頻次信息對所述用戶的偏好進行評分,得出所述用戶的偏好信息。
優(yōu)選地,所述第二分類規(guī)則為臨時構建的分類規(guī)則,且所述構建的方法參照所述第一分類規(guī)則的構建方法。
優(yōu)選地,所述第一分類規(guī)則的構建方法采用url匹配法或文本匹配法,并且對所述業(yè)務內容分類后所產生的網(wǎng)絡內容的分類粒度控制在預定級別以內。
本發(fā)明還提供了一種用戶偏好分析系統(tǒng),包括:
初始信息獲取模塊,用于基于用戶的訪問行為獲取所述用戶訪問的初始信息;
內容信息分類模塊,用于對所述初始信息中所述用戶所涉及的網(wǎng)絡內容進行分類處理,得到內容信息;
頻次信息排序模塊,用于對初始信息中所述用戶所涉及的用戶瀏覽頻次進行整理,得到頻次信息;
評分模塊,用于根據(jù)所述內容信息和頻次信息對所述用戶的偏好進行評分,得出所述用戶的偏好信息。
優(yōu)選地,初始信息獲取模塊包括:
基礎數(shù)據(jù)獲取單元,用于根據(jù)所述用戶的訪問行為從服務器中得到所述用戶訪問的基礎數(shù)據(jù);
擴展單元,用于根據(jù)所述基礎數(shù)據(jù)獲取所述用戶訪問的業(yè)務內容,并根據(jù)所述基礎數(shù)據(jù)的增加,對所述業(yè)務內容進行擴展,生成所述初始信息。
優(yōu)選地,所述內容信息分類模塊包括:
包括判斷單元,用于判斷所述初始信息中每一業(yè)務內容是否具有預設的第一分類規(guī)則,并得一判斷結果;
分類單元,用于對所述判斷結果為具有所述第一分類規(guī)則的業(yè)務內容,按照所述第一分類規(guī)則對所述業(yè)務內容進行分類;
對所述判斷結果為不具有所述第一分類規(guī)則的業(yè)務內容,按照第二分類規(guī)則對所述業(yè)務內容進行分類。
優(yōu)選地,所述分類單元所構建的第二分類規(guī)則為臨時構建的分類規(guī)則,且所述構建的方法參照所述第一分類規(guī)則的構建方法。
優(yōu)選地,所述分類單元所構建的第一分類規(guī)則的構建方法采用url匹配法或文本匹配法,并且對所述業(yè)務內容分類后所產生的網(wǎng)絡內容的分類粒度控制在預定級別以內。
綜上所述,本發(fā)明具有以下優(yōu)點:
本發(fā)明通過以上技術方案,通過綜合和關聯(lián)不同性質業(yè)務的內容來定位用戶的偏好,其對內容分類的準確度要求較低,因此其內容分類算法的復雜度也較低;在資源需求和推廣可行性方面,本技術方案基于簡單的系統(tǒng)架構,對硬件資源要求很低,容易在各地推廣。
附圖說明
圖1為本實施例偏好分析方法的流程示意圖;
圖2為本實施例的偏好分析系統(tǒng)的結構框圖。
具體實施方式
下面結合實施方式及附圖對本發(fā)明作進一步詳細、完整地說明。
如圖1-2所示,一種用戶偏好分析方法,包括以下步驟:
基于用戶的訪問行為獲取所述用戶訪問的初始信息;
對所述初始信息中所述用戶所涉及的網(wǎng)絡內容進行分類處理,得到內容信息;
對初始信息中所述用戶所涉及的用戶瀏覽頻次進行整理,得到頻次信息;
根據(jù)所述內容信息和頻次信息對所述用戶的偏好進行評分,得出所述用戶的偏好信息。
所述基于用戶的訪問行為獲取所述用戶訪問的初始信息包括:
根據(jù)所述用戶的訪問行為從服務器中得到所述用戶訪問的基礎數(shù)據(jù);
根據(jù)所述基礎數(shù)據(jù)獲取所述用戶訪問的業(yè)務內容,并根據(jù)所述基礎數(shù)據(jù)的增加,對所述業(yè)務內容進行擴展,生成所述初始信息。
所述對所述初始信息中用戶所涉及的網(wǎng)絡內容進行分類處理包括:
基于用戶的訪問行為獲取所述用戶訪問的初始信息;
判斷所述初始信息中每一業(yè)務內容是否具有預設的第一分類規(guī)則,并得一判斷結果;
對所述判斷結果為具有所述第一分類規(guī)則的業(yè)務內容,按照所述第一分類規(guī)則對所述業(yè)務內容進行分類;
對所述判斷結果為不具有所述第一分類規(guī)則的業(yè)務內容,按照第二分類規(guī)則對所述業(yè)務內容進行分類;
根據(jù)所述內容信息和頻次信息對所述用戶的偏好進行評分,得出所述用戶的偏好信息。
所述第二分類規(guī)則為臨時構建的分類規(guī)則,且所述構建的方法參照所述第一分類規(guī)則的構建方法。
所述第一分類規(guī)則的構建方法采用url匹配法或文本匹配法,并且對所述業(yè)務內容分類后所產生的網(wǎng)絡內容的分類粒度控制在預定級別以內。
本發(fā)明還提供了一種用戶偏好分析系統(tǒng),包括:
初始信息獲取模塊,用于基于用戶的訪問行為獲取所述用戶訪問的初始信息;
內容信息分類模塊,用于對所述初始信息中所述用戶所涉及的網(wǎng)絡內容進行分類處理,得到內容信息;
頻次信息排序模塊,用于對初始信息中所述用戶所涉及的用戶瀏覽頻次進行整理,得到頻次信息;
評分模塊,用于根據(jù)所述內容信息和頻次信息對所述用戶的偏好進行評分,得出所述用戶的偏好信息。
初始信息獲取模塊包括:
基礎數(shù)據(jù)獲取單元,用于根據(jù)所述用戶的訪問行為從服務器中得到所述用戶訪問的基礎數(shù)據(jù);
擴展單元,用于根據(jù)所述基礎數(shù)據(jù)獲取所述用戶訪問的業(yè)務內容,并根據(jù)所述基礎數(shù)據(jù)的增加,對所述業(yè)務內容進行擴展,生成所述初始信息。
所述內容信息分類模塊包括:
包括判斷單元,用于判斷所述初始信息中每一業(yè)務內容是否具有預設的第一分類規(guī)則,并得一判斷結果;
分類單元,用于對所述判斷結果為具有所述第一分類規(guī)則的業(yè)務內容,按照所述第一分類規(guī)則對所述業(yè)務內容進行分類;
對所述判斷結果為不具有所述第一分類規(guī)則的業(yè)務內容,按照第二分類規(guī)則對所述業(yè)務內容進行分類。
所述分類單元所構建的第二分類規(guī)則為臨時構建的分類規(guī)則,且所述構建的方法參照所述第一分類規(guī)則的構建方法。
所述分類單元所構建的第一分類規(guī)則的構建方法采用url匹配法或文本匹配法,并且對所述業(yè)務內容分類后所產生的網(wǎng)絡內容的分類粒度控制在預定級別以內
同時本發(fā)明上述實施例僅為說明本發(fā)明技術方案之用,僅為本發(fā)明技術方案的列舉,并不用于限制本發(fā)明的技術方案及其保護范圍。采用等同技術手段、等同設備等對本發(fā)明權利要求書及說明書所公開的技術方案的改進應當認為是沒有超出本發(fā)明權利要求書及說明書所公開的范圍。