• 基于混沌PSO的高维多视图数据IWKM聚类算法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2020-09-28 合作期刊: 《计算机应用研究》

    摘要: 针对传统聚类算法无法处理大数据中多视图高维数据问题,提出了一种基于混沌粒子群优化算法的智能加权K均值聚类算法。首先,在聚类模型中引入聚类之间的耦合程度以扩大聚类的相似性。其次,为了消除初始聚类中心的敏感性,利用混沌粒子群优化算法通过全局搜索得到最优初始聚类中心、视图权重和特征权重。然后,引入一种精确摄动策略提高混沌粒子群优化算法的寻优性能。最后通过在apache spark和single node两个平台上的实验验证了提出的方法在视图多、维数高的复杂数据集条件下具有较好的聚类性能。

  • 一种减少色彩失真的自适应单幅图像去雾算法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-04-01 合作期刊: 《计算机应用研究》

    摘要: 基于暗通道先验的单幅图像去雾算法是目前最为高效的图像去雾技术,然而当图像中某些场景不完全满足暗通道先验时,去雾处理后的图像中常常出现大量伪影和色彩失真,因此需要根据图像对该方法进行修正。假设图像场景亮度越高,暗通道越不可信;场景饱和度越低,暗通道越不可信。基于该假设重新设计了图像的暗通道置信度,以补偿场景不完全满足暗通道先验时估算过大的暗通道值;另外对图像进行后置增强处理,以提升图像的视觉效果。提出的算法对三类具有代表性的雾天图像进行实验,实验结果显示,与相关算法相比,该算法在缓解色彩失真、去除伪影等方面表现更好。该算法通过设计暗通道置信度克服了图像场景不完全满足暗通道先验时暗通道值估计偏大的问题,显著提升了暗通道先验去雾模型对不同雾天场景的适应能力。

  • 基于范畴论的业务目标模型形式化

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-04-01 合作期刊: 《计算机应用研究》

    摘要: 面向目标需求语言模型(goal-oriented requirement language,GRL)聚焦于待定的需求,被广泛地应用于业务系统的初始需求建模,其模型的正确性影响到业务系统的开发质量。鉴于业务目标模型的形式化可以验证模型的正确性,提出了一种利用范畴论形式化GRL模型的方法。首先,依据GRL元模型结构,应用范畴论中的态射机制形式化描述GRL模型中目标与目标、目标与任务以及任务与任务等节点之间的关系;然后,通过增加范畴模型中的初始对象和终止对象,设计紧邻序列来表示多个目标与任务实施的因果关系;最后,设计业务目标模型系统的正确性结构性质。应用Web Payment系统实验表明,形式化业务范畴模型能够验证GRL模型的正确性,提高目标建模的质量。

  • 基于开放域抽取的多文档概念图构建研究

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-11-29 合作期刊: 《计算机应用研究》

    摘要: 在信息过载的背景下,如何从拥有共同主题的多篇文档中挖掘并组织核心概念及其语义连接已成为当前开放式信息抽取任务中的一项重要挑战。为此,提出了一个基于开放域抽取的多文档概念图构建模型。首先基于预定主题挖掘主题词,通过改进的TF-IDF算法对文档进行排序;然后通过共指消解、篇章权重计算、开放域抽取等一系列的方法从多篇文章中抽取出大量具有事实表达能力的三元组实例。为去除开放域方法本身的噪声以及提升信息抽取的准确率,提出一种事实过滤算法。通过该算法可有效提取置信度高且具有良好语义兼容性的显著事实知识集合,并构成多个概念子图。最后,将不同子图中等价的概念以及关系进行合并,形成一张具有主题表达能力的连通概念图。通过在Signal Media新闻数据集上进行验证,实验结果表明,所提出的模型能够跨文档挖掘并有效组织与特定主题相关的关键信息,形成的概念图在主题概念覆盖率、事实知识的兼容性等指标上均取得了较好的效果。除此之外,该模型对于自动文档摘要的应用也具有重要的参考价值。