分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]大数据时代需要将人数据化,科研人员也需要数据化。科研人员画像的建立,对于科研管理层全面了解科研人员的信息、客观评价其研究水平等有重要作用,可以作为分析科研人员研究行为或专家推荐的基础,提高科研管理效率。[方法/过程]首先提出科研人员画像的概念,认为其是描述科研人员信息的标签的集合。其次,以个人主页、知网、基金网等多个异构数据源的数据为基础,提出融合多源数据的科研人员画像构建方法,分别从科研人员的基础属性、科研偏好和科研关系三方面形式化描述了科研人员信息,并提取各个维度的标签,以可视化的方式展示其画像。最后,分别以国内外两位科研人员为例,说明了科研人员画像构建方法的可行性。[结果/结论]科研人员画像的构建适用于国内外的科研人员,能够全面描述科研人员信息并直观展示出来。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]随着科技文献资源的急剧增长,用户淹没在科技文献的海洋中,为用户提供快速、精准的细粒度知识元服务将成为未来文献知识检索的发展趋势。[方法/过程]在分析科技文献文本结构的基础上,逐步深入到科技文献的内容中,以期通过构建一种面向科技文献知识表示的知识元本体模型,将科技文献内容中句义完整的细粒度知识点表示成具有统一结构的知识元。[结果/结论]以一篇科技文献为实例,展示笔者提出的基于知识元本体模型的科技文献知识表示方法,但该示例仅呈现了科技文献中引言部分的相关知识点,需进一步验证该知识元本体模型的有效性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】对在线评论进行分析, 揭示评论文本主题的内容和情感分布变化规律。【方法】使用融入先验信 息的 SSTM 模型获得评论文档的情感分布, 以文档、文档情感分布和词项为可视变量, 提出 DSTM 模型, 并估算 情感主题分布和主题词项分布。【结果】将采集的评论数据集按时间片划分进行建模, 实验得到主题的内容和情 感随时间的变化趋势。【局限】未考虑不同主题之间的关联关系, 建模结果可能存在一定误差。【结论】融合时 间外部特征的 DSTM 模型, 能够有效地对在线评论进行主题演化分析。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】针对网络中海量的Web 服务, 提出一种有效的Web 服务聚类与发现方法。【方法】利用BTM 学习整个Web 服务描述文档集的隐含主题, 通过推理得出每个文档的主题分布, 并进行聚类。在此基础上, 创建一个快速的Web 服务发现机制。【结果】与使用LDA 和外部语料库等方法进行对比实验, 本文方法的查准率和标准折损累计增益果显示该方法可以更准确地发现符合用户需求的服务。