關鍵詞:數(shù)據(jù)分類算法 貝葉斯算法 海量數(shù)據(jù)處理
摘要:針對目前機器學習研究領域中的數(shù)據(jù)分類問題,選擇樸素貝葉斯算法作為研究對象。首先,通過對樣本數(shù)據(jù)特征屬性的權重進行加權調整,提高算法處理的準確率;然后,改進樸素貝葉斯算法分類器模型,使其能夠利用Map/Reduce并行編程模型,采用多計算資源節(jié)點并行處理,進一步提高處理速度。最后,對UCI dataset數(shù)據(jù)庫進行實驗驗證,結果表明:改進后的算法在海量數(shù)據(jù)分類處理中具有更好的性能表現(xiàn)。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社