基于最近邻距离权重的ML-KNN算法

作者： 陆凯 ¹ 徐华 ¹
作者单位：

1. 江南大学物联网工程学院
提交时间：2019-01-28 14:33:27

摘要: 在大数据环境下，K近邻多标签算法（ML-KNN）高时间复杂度的问题显的尤为突出；此外，ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究，首先将训练集进行聚类，再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集；然后计算最近邻样本的距离权重，并用该权重描述最近邻和其他近邻对预测结果的影响；最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明，所提算法得到了更好的分类结果，并且大大降低了时间复杂度。

多标签分类 ML-KNN 聚类最近邻距离权重

期刊： 计算机应用研究
分类： 计算机科学 >> 计算机科学的集成理论
引用： ChinaXiv:201901.00190 (或此版本 ChinaXiv:201901.00190V1)
DOI:10.12074/201901.00190V1
CSTR:32003.36.ChinaXiv.201901.00190.V1
推荐引用方式： 陆凯,徐华.(2019).基于最近邻距离权重的ML-KNN算法.计算机应用研究.[ChinaXiv:201901.00190] (点此复制)

版本历史

[V1]

2019-01-28 14:33:27

ChinaXiv:201901.00190V1

下载全文

相关论文推荐

1. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
2. 基于大语言模型的中英文整合复杂性建模研究	2024-04-10
3. 大模型与标准文献知识库的融合应用探索	2024-04-10
4. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
5. 引导大语言模型生成计算机可解析内容	2024-04-07
6. 基于 Python 中 MeCab 库对日语文章进行文本分析处理实现	2024-04-04
7. 一种基于能量-信息转换的智能测度	2024-03-30
8. 基于大语言模型的中庸思维对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
9. 收入分配不平等对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
10. 基于文本数据增强的生活满意度预测模型优化	2024-02-29


公开评论匿名评论仅发给作者