分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: 针对网格密度聚类算法存在的网格宽度和密度阈值难以确定、以及聚类精度不高的缺陷,提出了一种参数自适应的网格密度聚类算法。定义了数据集的标准化离散度的概念,运用数据集的自然分布信息自适应的计算出每一维较优的分割宽度,对不同的密度阈值统计其噪声样本对象的数量,绘制了噪声曲线,从噪声曲线中获得最佳的密度阈值,而且增加了类簇边缘处理技术,进一步提高了聚类的质量。仿真实验表明,改进后的算法可获得更好的聚类效果。