技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明實施例提供了一種文本分類方法及裝置,應(yīng)用于計算機(jī)技術(shù)領(lǐng)域,所述方法包括:通過文本表示將待分類文本映射為向量空間模型VSM中的第一文本向量。根據(jù)預(yù)先建立的語義平滑矩陣將所述第一文本向量映射為高維空間中的第一映射向量,其中,所述語義平滑矩陣是通過對統(tǒng)計相似度矩陣和詞語相似度矩陣進(jìn)行計算得到。對所述第一映射向量進(jìn)行分類,得到所述待分類文本的文本分類結(jié)果。本發(fā)明實施例通過將基于世界知識的詞語相似度和基于統(tǒng)計的詞語相似度應(yīng)用于文本分類,提高了文本分類的準(zhǔn)確性。
技術(shù)研發(fā)人員:姚海鵬;張博;張培穎;章?lián)P;王露瑤;殷志強(qiáng)
受保護(hù)的技術(shù)使用者:北京郵電大學(xué)
技術(shù)研發(fā)日:2017.05.02
技術(shù)公布日:2017.09.08