分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2020-09-28 合作期刊: 《计算机应用研究》
摘要: 为了去除差异序列模式挖掘算法返回结果中的假阳性差异序列模式,提出了一个基于标准置换假设检验的算法SP-DSP。该算法首先运用GSP算法挖掘频繁序列模式,然后基于Growth rate阈值生成差异序列模式候选集,并运用标准置换检验计算候选集合中每个模式的p-value,最后运用多重假设检验度量过滤假阳性差异序列模式。实验结果证明SP-DSP算法能够去除掉一定数量的假阳性模式并尽可能地保留真差异序列模式,从而促进后续分类任务正确率的提升。