分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-10-11 合作期刊: 《计算机应用研究》
摘要: 潜在狄利克雷分布(LDA)是一种流行的三层贝叶斯概率模型,其实现了文本与文本中的单词在主题层次上的聚类。LDA以词袋(Bag of Words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。为解决此问题,提出了一种基于语义分布相似度的主题模型。该模型在EM(Expectation Maximization)算法框架下,使用GPU(generalized Pólya urn)模型加入单词-单词和文档-主题语义分布相似度来引导主题建模,从语义关联层面上削弱了词袋假设对主题产生的影响。在四个公开数据集上的实验表明,基于语义分布相似度的主题模型在主题语义连贯性、文本分类准确率方面相对于目前流行主题建模算法表现的更加优越,同时该模型提高了收敛速度和模型精度。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-24 合作期刊: 《计算机应用研究》
摘要: 准确预测蛋白质变性温度在蛋白质工程和药物研制等领域具有重要意义。将全局特征和序列特征作为初始特征向量,利用提出的基于权值的降维算法对初始特征向量进行降维,降维后的特征输入多层感知机模型预测蛋白质变性温度。在盲测数据集上,该方法预测结果与实验测定结果的PCC值由降维前的0.77增加到0.8,RMSE值由降维前的0.17降低到了0.16,蛋白质变性温度预测值的分类准确率与现有方法比较有明显提升。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-02 合作期刊: 《计算机应用研究》
摘要: 电信运营商为了发现可能离网的客户,针对不同的场景研究开发了多种离网预测模型。目前的离网预测模型首先选择一种时间粒度抽取特征,之后使用机器学习算法对抽取的数据建模。这类方法只考虑了模型对分类性能的影响,没有充分考虑数据的作用。针对上述问题,提出一种使用多种时间粒度抽取特征的方法,并尝试在模型训练的不同阶段对不同粒度的特征进行融合。实验结果表明,使用多种粒度抽取特征训练出来的模型性能会明显优于使用单一粒度抽取特征的模型。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-24 合作期刊: 《计算机应用研究》
摘要: 随着移动通信技术的发展和移动设备的普及,关于人们日常移动行为的轨迹数据记录愈发的丰富起来。海量的轨迹数据背后隐藏着关于人及人类社会的有价值的知识模式。为了使基于轨迹数据产生的知识模式更精准有效服务用户,能够准确、可靠地恢复缺失电信轨迹显得尤为重要。目前大多数方法主要针对GPS轨迹等连续轨迹进行建模,而缺乏对移动通信场景中产生的电信轨迹恢复的研究。因此,针对电信轨迹缺失恢复问题,将电信轨迹恢复问题转化为矩阵补全问题,提出了一种基于LDA主题模型的恢复算法。实验中,与传统矩阵补全算法进行综合比较,并观察了不同参数对轨迹恢复效果的影响。实验结果表明,与传统矩阵补全算法相比,运用LDA主题模型能够显著提高缺失电信轨迹的恢复精度。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-19 合作期刊: 《计算机应用研究》
摘要: 随着无线传感器网络的高速发展和多种移动智能设备的普及,移动群智感知(mobile crowd sensing,MCS)成为移动计算的核心。利用群智感知可完成大规模、复杂环境及社会感知任务,其中任务分发是这种应用中的一个重要环节。针对任务分发过程中存在感知环境复杂、用户数量达不到要求、收集数据质量低等问题,提出一种基于社交属性及有效用户计算的任务分发机制(effective user calculation,EUC),该机制具有根据任务来筛选用户的特点,从用户角度看,EUC考虑了用户的社会性,由用户的社交网络传递相关信息来增加平台的有效用户数;从平台的角度看,EUC可根据任务的接收和提交情况,动态调整有效用户的积分,从而保障整个系统的有效用户数。理论分析和实验结果表明,所提出的机制可提高系统的任务分发效率,并改善了收集数据的质量。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-17 合作期刊: 《计算机应用研究》
摘要: 延迟容忍网络是一种缺乏持续连接的新型网络体系结构,选择合适的转发节点是实现延迟容忍网络高效的转发和投递消息的关键问题。由于节点移动性和网络拓扑动态变化等会对延迟容忍网络的传输效率产生影响,提出了一种基于节点社会性和利用随机线性网络编码的DTN网络模型NSNC-DTN。NSNC-DTN网络模型利用网络中的社团结构、社团紧密度以及节点活跃度,选择出最合适的转发节点。离线计算节点的社会性,对源节点和Center节点进行随机线性网络编码,在线完成转发,从而达到高效转发和投递的目的。仿真结果表明NSNC-DTN网络能够有效地提高信息投递成功率,减小端对端的网络延迟和网络开销。