摘要:目前存在的中文命名實體識別方法依賴于大量標注數(shù)據(jù),但是某些領(lǐng)域標注數(shù)據(jù)的獲取成本十分高昂.通過引入遷移學(xué)習(xí)技術(shù),降低了實體識別模型對于大量標注數(shù)據(jù)的需求.論文從大規(guī)模非結(jié)構(gòu)化文本數(shù)據(jù)出發(fā),利用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建語言預(yù)測模型,將其作為遷移學(xué)習(xí)源模型;同時,基于上下文特征的字符級向量生成算法遷移源模型知識至實體識別模型,最終構(gòu)建出遷移學(xué)習(xí)模型:Trans-NER.實驗結(jié)果顯示,提出的模型表現(xiàn)優(yōu)于其他實體識別模型.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社