摘要:圖聚集技術(shù)是將一個(gè)大規(guī)模圖用簡(jiǎn)潔的小規(guī)模圖來(lái)表示,同時(shí)保留原始圖的結(jié)構(gòu)和屬性信息的技術(shù)?,F(xiàn)有算法未同時(shí)考慮節(jié)點(diǎn)的屬性信息與邊的權(quán)重信息,導(dǎo)致圖聚集后與原始圖存在較大差異。因此,提出一種同時(shí)考慮節(jié)點(diǎn)屬性信息與邊權(quán)重信息的圖聚集算法,使得聚集圖既保留了節(jié)點(diǎn)屬性相似度又保留了邊權(quán)重信息。該算法首先定義了閉鄰域結(jié)構(gòu)相似度,通過(guò)一種剪枝策略來(lái)計(jì)算節(jié)點(diǎn)之間的結(jié)構(gòu)相似度;其次使用最小哈希(MinHash)技術(shù)計(jì)算節(jié)點(diǎn)之間的屬性相似度,并調(diào)節(jié)結(jié)構(gòu)相似與屬性相似所占的比例;最后,根據(jù)2方面相似度的大小對(duì)加權(quán)圖進(jìn)行聚集。實(shí)驗(yàn)表明了該算法可行且有效。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社