Current Location:home > Browse

1. chinaXiv:201711.01942 [pdf]

结合链路预测和ET机器学习的科研合作推荐方法研究

吕伟民; 王小梅; 韩涛
Subjects: Library Science,Information Science >> Information Science

【目的】结合链路预测与机器学习, 提出推荐未来科研合作的新方法, 以提高单独基于链路预测方法的推荐精确度。【方法】构建加权作者合作网, 以不同的链路预测指标作为特征输入, 运用极端随机树(Extremely Randomized Trees, ET)机器学习算法训练分类, 并利用遍历算法求取分类结果的最优权重组合, 选取TOP 准确度的预测作为合作推荐结果。【结果】选取纳米科技领域2008 年–2010 年SCI 论文数据进行实证。在城市合作推荐中, 改进的ET 方法优于已有方法, 有良好的推荐成功率; 预测方法受网络结构等因素影响较小, 适用范围更广泛。【局限】科研合作受合作动机、地域、语言等诸多因素影响, 加权作者合作网没有反映在一篇论文中同城市、同机构的多个作者, 也没有反映上述因素。【结论】改进算法能够比单个预测指标产生更准确的合作推荐建议, 也为推广到大学等机构、个人等更微观的应用层面提供参考。

submitted time 2017-11-08 From cooperative journals:《数据分析与知识发现》 Hits3018Downloads2212 Comment 0

2. chinaXiv:201711.02031 [pdf]

文献–作者二分网络中基于路径组合的合著关系预测研究

张金柱; 王小梅; 韩涛
Subjects: Library Science,Information Science >> Information Science

【目的】降低文献–作者二分网络在投影为合著网络过程中的信息丢失影响, 形成适应特定二分网络的合著关系预测指标和方法, 提高预测准确率和结果可解释性。【方法】首先构建文献–作者二分网络及其投影合著网络; 接着抽取二分网络中的二阶路径和三阶路径表示作者间的关联关系; 最后利用逻辑回归方法学习不同路径对于合著关系预测的贡献, 由此形成文献–作者二分网络中基于路径组合的合著关系预测指标。【结果】在图书情报领域的实验证实, 文献–作者二分网络在投影为合著网络过程中存在较大的信息丢失, 并以合著关系预测准确率变化进行定量计算; 逻辑回归方法适合学习不同路径对于合著关系预测的贡献, 由此形成的路径组合指标准确率远远高出其他指标, 并且预测结果更易解释。【局限】其他的多阶路径尚未引入到该模型中, 方法通用性还需在其他领域进行验证。【结论】合著关系预测应直接在文献–作者二分网络上进行, 以降低投影过程中的信息丢失影响; 文献–作者二分网络上的路径组合指标是合著关系预测的最优指标; 该方法可扩展应用到其他类型的二分网络中, 如专利–发明人二分网络。

submitted time 2017-11-08 From cooperative journals:《数据分析与知识发现》 Hits1216Downloads780 Comment 0

  [1 Pages/ 2 Totals]