摘要:目的 通過TCGA數(shù)據(jù)庫基因突變信息結(jié)合機器學(xué)習軟件RapidMiner構(gòu)建肝細胞癌患者復(fù)發(fā)模型。方法 首先通過TCGA數(shù)據(jù)庫收集316例肝細胞癌患者的臨床資料和全基因組測序的突變基因信息;然后利用R語言和SPSS19.0篩選出前127個高頻突變基因和12個與無疾病生存期(disease-free survival period,DFS)顯著相關(guān)的高頻突變基因;通過RapidMiner8.0機器學(xué)習軟件,利用316例患者的突變基因信息訓(xùn)練決策樹和支持向量機(support vector machine,SVM)模型。結(jié)果 通過利用 TCGA數(shù)據(jù)庫篩選的基因構(gòu)建的決策樹模型準確率為77.42%,通過構(gòu)建SVM模型佐證決策樹模型的最大準確率為77.42%。結(jié)論 通過公共數(shù)據(jù)庫構(gòu)建的肝細胞癌患者的復(fù)發(fā)模型,可在臨床上用來分析患者的基因檢測報告,除了提供藥物治療靶點的信息外,還可初步判斷患者的預(yù)后;此外,對于部分經(jīng)濟條件受限的患者可重點針對決策樹中的基因進行檢測,來預(yù)測預(yù)后及復(fù)發(fā)可能。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社