關(guān)鍵詞:名詞詞組模式 birch聚類算法 pmi算法
摘要:本文對于意見挖掘領(lǐng)域中的評價(jià)對象的修剪和聚類問題,提出使用K-means聚類算法和BIRCH聚類算法相結(jié)合的方式來進(jìn)行評價(jià)對象的修剪和聚類。利用BIRCH算法類別聚類的功能對評價(jià)對象進(jìn)行聚類,并刪除包含較少數(shù)據(jù)的簇來實(shí)現(xiàn)修剪評價(jià)對象;再通過對于剩下的簇使用K-means聚類算法來獲得最優(yōu)評價(jià)對象。這種修剪聚類方法與以往的基于PMI算法修剪然后基于K-means聚類算法相比,減少了評價(jià)對象修剪時對語料庫的依賴,最終聚類的結(jié)果更加精準(zhǔn),而且BIRCH算法采用一次掃描數(shù)據(jù)庫的策略,可以有效提高速度。
軟件雜志要求:
{1}來稿若有基金項(xiàng)目或其他資金資助項(xiàng)目,請?jiān)敿?xì)列出基金或其他資金項(xiàng)目類型、名稱及編號,每篇來稿的基金項(xiàng)目或其他資金資助項(xiàng)目原則上不超過3個。
{2}編輯部收到稿件后立即編號,并給回執(zhí),日后聯(lián)系時請注明編號。在接到本刊回執(zhí)3個月未接到稿件處理通知書,系該稿仍在審閱中。
{3}參考文獻(xiàn)盡可能使用近5年公開發(fā)表的文獻(xiàn),數(shù)量在10—30條,采用順序編碼制著錄,依照其在文中出現(xiàn)的先后順序用阿拉伯?dāng)?shù)字標(biāo)出,并將序號置于方括號中,排列于文后。
{4}每篇文稿均應(yīng)標(biāo)引3~8個中文及英文關(guān)鍵詞。
{5}來稿需注明作者的真實(shí)姓名、單位、地址、郵編、職務(wù)、專業(yè)等信息,寫明電子郵箱及電話以便聯(lián)系。凡學(xué)生來稿請務(wù)必注明學(xué)校、專業(yè)和年級。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社