基于WLabeled-LDA模型的文本分類研究

作者:卜天然 安徽商貿(mào)職業(yè)技術(shù)學(xué)院; 安徽蕪湖241002

摘要:Labeled-LDA模型引入了類別標(biāo)簽信息,較傳統(tǒng)的LDA主題模型改進(jìn)了強制分配主題的問題,但Labeled-LDA模型仍存在一些問題,例如Labeled-LDA在訓(xùn)練主題模型之前沒有去除無用詞,在訓(xùn)練過程中沒有考慮詞與各類別的關(guān)聯(lián)度,且Labeled-LDA模型獲得的主題分布傾向于高頻詞,導(dǎo)致主題的表達(dá)能力降低等問題。本文提出WLabeled-LDA模型,在訓(xùn)練主題模型之前使用卡方特征來選出好的特征詞,訓(xùn)練主題模型時用獲得的詞對類別的卡方值進(jìn)行主題模型加權(quán),并使用高斯密度函數(shù)對特征詞加權(quán)來降低高頻詞對主題表達(dá)能力的影響。實驗結(jié)果顯示,此方法能使分類的準(zhǔn)確率和召回率得到一定的提高,說明其具有更好的分類效果。

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

長春師范學(xué)院學(xué)報

省級期刊 下單

國際刊號:2095-7602

國內(nèi)刊號:22-1409/G4

雜志詳情
相關(guān)熱門期刊

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。