您当前的位置: > 详细浏览

基于最近邻距离权重的ML-KNN算法

请选择邀稿期刊:
摘要: 在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显的尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类,再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集;然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且大大降低了时间复杂度。

版本历史

[V1] 2019-01-28 14:33:27 ChinaXiv:201901.00190V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1794
  •  下载量1139
评论
分享