ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2023
1

按主题分类

情报学
1

按作者

按机构

当前资源共 1条

隐藏摘要

点击量

时间

您选择的条件: 百度时代网络技术有限公司北京 100085

1. ChinaXiv:202304.00711
下载全文

基于深度学习算法的学术查询意图分类器构建

分类：图书馆学、情报学 >> 情报学提交时间： 2023-04-01 合作期刊: 《图书情报工作》

王瑞雪方婧桂思思陆伟张显

摘要： [目的/意义] 实现学术查询意图的自动识别，提高学术搜索引擎的效率。[方法/过程] 结合已有查询意图特征和学术搜索特点，从基本信息、特定关键词、实体和出现频率4个层面对查询表达式进行特征构造，运用Naive Bayes、Logistic回归、SVM、Random Forest四种分类算法进行查询意图自动识别的预实验，计算不同方法的准确率、召回率和F值。提出了一种将Logistic回归算法所预测的识别结果扩展到大规模数据集、提取“关键词类”特征的方法构建学术查询意图识别的深度学习两层分类器。[结果/结论] 两层分类器的宏平均F1值为0.651，优于其他算法，能够有效平衡不同学术查询意图的类别准确率与召回率效果。两层分类器在学术探索类的效果最好，F1值为0.783。

点击量 183 下载量 114 评论

友情链接: PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募预印本评审专家许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心