分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-06-19 合作期刊: 《计算机应用研究》
摘要: 离散二进制粒子群算法(BPSO)在各种离散优化问题中有着诸多优势,但其很容易由于非线性的问题陷入局部最优解,无法得到最佳特征子集。而降噪自编码器可通过多层非线性网络进行映射与重构,对中医药数据有良好的处理效果。因此提出了一种融合降噪自编码器与BPSO的特征组合方法,该方法主要是利用降噪自编码器对特征进行非线性映射形成超完备基,然后在超完备基中通过BPSO进行搜索,从而得到最佳特征子集。分别采用临床糖尿病数据集和UCI数据集进行分析处理,实验结果表明,融合降噪自编码器与BPSO的特征组合方法对中医药临床实验数据有较好的适应性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-02 合作期刊: 《计算机应用研究》
摘要: 针对传统的偏最小二乘法只考虑单特征的重要性以及特征之间存在冗余和多重共线性等问题,将特征之间的统计相关性引入到传统的偏最小二乘分析中,构造了一种基于特征相关的偏最小二乘模型。首先利用特征相关度对特征进行评估预选出特征组,然后将其放入偏最小二乘模型中进行训练,评估该特征组是否可取。结合前向贪心搜索策略依次评价候选特征,并选中使目标函数最小的候选特征加入到已选特征。分别采用麻杏石甘汤君药止咳、平喘和UCI数据集进行分析处理,实验结果表明,该特征选择方法能较好寻找较优的特征组。