分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-05-10 合作期刊: 《计算机应用研究》
摘要: K-means算法有实现简单、速度快的特点,是应用最广泛的聚类算法。针对K-means算法对初始聚类中心和噪声敏感的缺点,提出了d-K-means算法(distance&density),在K-means算法的基础上权衡了密度和距离对聚类的影响,对数据进行加权处理,在权值基础上引入“最小最大原则”选择初始聚类中心,自动确定类中心个数。实验结果表明,d-K-means算法在低维数据与高维数据上都可以取得较好的聚类效果,并且更好地应对低密度区域数据,更好地进行类中心选择。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: 为了能够在处理不同的数据类型或任务时得到良好的结果,设计了基于自适应假近邻方法的卷积神经网络(CNN)架构。将中心矩的思想应用在CNN的池化操作中,利用稀疏滤波算法实现训练过程的无监督化,并设置CNN算法的卷积掩模(卷积核)的大小和每层卷积单位(CNN神经元)的数量;此外,该架构还利用自适应假近邻方法实现简化建模和预测等任务。实验结果证实,提出的改进CNN架构的复杂度较低,它可以更快地接受训练并且不易产生过度拟合。