摘要:本文對(duì)新浪微博的博文一周后受到的轉(zhuǎn)發(fā)、評(píng)價(jià)、點(diǎn)贊的次數(shù)進(jìn)行了分析及預(yù)測(cè).首先采用聚類分析法,從訓(xùn)練集橫向和縱向、微博特征及用戶行為特點(diǎn)三個(gè)角度做了分析,得出了三種用戶行為與微博數(shù)量的關(guān)系、三種用戶行為之間的關(guān)系及用戶行為具有均值的特點(diǎn),然后結(jié)合分析結(jié)果,提出使用計(jì)算類別集合代替?zhèn)鹘y(tǒng)的求距離,使用雙層對(duì)象代替單層對(duì)象的改進(jìn)的KNN算法,使傳統(tǒng)KNN算法成為可預(yù)測(cè)模型.最后的實(shí)例仿真表明改進(jìn)后的KNN算法相對(duì)于其他傳統(tǒng)預(yù)測(cè)方法 F1評(píng)估值平均提高了5.15%.
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社
國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C