您选择的条件: 张显
  • 学术查询意图类目体系构建与分析:百度学术查询日志的实证

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 了解、分析和识别用户学术搜索时所表达的信息需求是优化查询结果、提高学术搜索引擎用户体验的首要步骤,而用户进行学术搜索时通过查询表达式所表达的用户表意信息需求及潜在信息需求可称之为学术查询意图。本文总结学术查询意图类目体系有助于学术查询意图识别和检索结果页面的呈现。[方法/过程] 在A.Broder的查询意图类目体系的基础上,结合百度学术搜索查询日志中查询表达式实例,构建学术查询意图的类目体系。以此为基础,总结不同类别的学术查询意图,并分析不同类别学术查询意图下查询表达式的特点。[结果/结论] 学术查询意图主要分为学术文献类、学术实体类、学术探索类、知识问答类和非学术文献类五大类;得出不同类别学术查询意图在学术搜索中的大致比例;给出每类学术查询意图的查询表达式特征、查询情景和查询结果页。

  • 基于深度学习算法的学术查询意图分类器构建

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 实现学术查询意图的自动识别,提高学术搜索引擎的效率。[方法/过程] 结合已有查询意图特征和学术搜索特点,从基本信息、特定关键词、实体和出现频率4个层面对查询表达式进行特征构造,运用Naive Bayes、Logistic回归、SVM、Random Forest四种分类算法进行查询意图自动识别的预实验,计算不同方法的准确率、召回率和F值。提出了一种将Logistic回归算法所预测的识别结果扩展到大规模数据集、提取“关键词类”特征的方法构建学术查询意图识别的深度学习两层分类器。[结果/结论] 两层分类器的宏平均F1值为0.651,优于其他算法,能够有效平衡不同学术查询意图的类别准确率与召回率效果。两层分类器在学术探索类的效果最好,F1值为0.783。

  • 基于对偶图正则化的多层概念分解算法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-18 合作期刊: 《计算机应用研究》

    摘要: 摘 要:为了进一步挖掘数据间的隐藏信息,在多层概念分解(MCF)算法的框架下,考虑每一层分解下的数据流形和特征流形,提出了一种基于对偶图正则化的多层概念分解(DGMCF)算法。该算法通过对数据的逐层分解,以分层的方式学习,并在每一层分解数据中构建数据空间和特征属性空间的拉普拉斯图,用于反映数据流形和特征流形的多元几何结构信息,从而能够更好地从复杂数据中提取出更有效的特征。采用交替迭代的方法求解算法的目标函数并证明了算法的收敛性。通过在三个真实数据库(TDT2、PIE、COIL20) 上的实验表明,该方法在数据的聚类表示效果方面优于其他方法。

  • 钝齿棒杆菌中异源表达N-乙酰鸟氨酸脱乙酰基酶合成L-鸟氨酸的研究

    分类: 生物学 >> 生物工程 提交时间: 2018-04-19 合作期刊: 《中国生物工程杂志》

    摘要: 目的:对一株产鸟氨酸的钝齿棒杆菌Corynebacterium crenatum SYPA5-5/△proB/△argF (SYPO-1) 进行代谢工程改造,筛选不同细菌来源的N-乙酰鸟氨酸脱乙酰基酶在大肠杆菌中克隆与表达,纯化后对其进行酶学性质的比较;将粘质沙雷氏菌Serratia marcescens Y213来源的SmargE基因编码的N-乙酰鸟氨酸脱乙酰基酶在L-鸟氨酸生产菌株C. crenatum SYPO-1中过量表达,进一步提高L-鸟氨酸的产量。方法:通过利用pDXW10穿梭质粒对不同来源的N-乙酰鸟氨酸脱乙酰化酶进行克隆表达和酶学性质比较,选择性质最优来源的N-乙酰鸟氨酸脱乙酰基酶编码基因SmargE在产L-鸟氨酸重组钝齿棒杆菌中表达,考察重组菌株发酵过程中参数的变化。结果:来源S. marcescens Y213的N-乙酰鸟氨酸脱乙酰基酶比酶活最高为798.98 U/mg,最适pH为7,最适温度为37 ℃,0.1 mM的Mg2+, Li+, Mn2+ 金属离子促进酶的比酶活提高了50%;在钝齿棒杆菌中表达N-乙酰鸟氨酸脱乙酰基酶酶活达到128.4 U/mL,显著提高了钝齿棒杆菌中胞内乙酰基循环水平;5-L发酵罐发酵重组菌株96 h,L-鸟氨酸的产量达到38.5 g/L,比出发菌株,N-中L-鸟氨酸的产量提高了33.2%,产率达0.401 g/L/h。结论:筛选出最佳来源的N-乙酰鸟氨酸脱乙酰基酶,在鸟氨酸生产菌株C. crenatum (SYPO-1)中过量表达,可以促进鸟氨酸的前体物质N-乙酰鸟氨酸的快速消耗,实现鸟氨酸的积累。