基于LSTM算法在新聞分類中的應(yīng)用

作者:朱肖穎; 賴紹輝; 陸科達(dá) 梧州學(xué)院大數(shù)據(jù)與軟件工程學(xué)院; 廣西梧州543002

摘要:針對傳統(tǒng)的RNN算法存在梯度消失的缺陷,在面對海量新聞數(shù)據(jù),規(guī)模大且分類屬性多的情況下存在效率低的問題,該文應(yīng)用了傳統(tǒng)的RNN模型改進(jìn)后的LSTM神經(jīng)網(wǎng)絡(luò)算法,加入了預(yù)訓(xùn)練的word2vec模型。首先對新聞數(shù)據(jù)進(jìn)行去除停用詞及標(biāo)點、格式轉(zhuǎn)化、分詞等預(yù)處理;其次進(jìn)行特征提取、分類模型構(gòu)造;最后進(jìn)行了分類模型訓(xùn)練與測試。測試數(shù)據(jù)表明,在大數(shù)據(jù)量的情況下,使用LSTM算法具有較高的模型準(zhǔn)確度和良好的擴展性。

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

梧州學(xué)院學(xué)報

省級期刊 下單

國際刊號:1673-8535

國內(nèi)刊號:45-1352/Z

雜志詳情
相關(guān)熱門期刊

服務(wù)介紹LITERATURE

正規(guī)發(fā)表流程 全程指導(dǎo)

多年專注期刊服務(wù),熟悉發(fā)表政策,投稿全程指導(dǎo)。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認(rèn)可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴(yán)格保密

誠信服務(wù),簽訂協(xié)議,嚴(yán)格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。