分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】为了准确地给专利申请书分配 IPC 分类号, 本文提出一种基于多特征多分类器集成的专利自动分 类方法。【方法】使用从专利申请书中提取的全词典 TFIDF 特征、信息增益词典 TFIDF 特征、段落向量特征、 主题模型向量特征, 分别训练朴素贝叶斯、支持向量机、AdaBoost 分类器, 以此构建特征–类别矩阵, 并结合 F1 权重矩阵集成, 获得最终 IPC 预测分类号。【结果】对 2014 年–2016 年“发动机或泵”领域的 10 个小类进行分 类, 使用 Top Prediction、All Categories 和 Two Guesses 三种评估方法得到准确率分别为: 78.9%、80.1%、91.2%。 【局限】训练仅仅使用了 2014 年–2016 年共三年的专利数据, 数据规模有限。【结论】在“发动机或泵”领域, 本文 方法能够有效地提高专利文本分类的准确率。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》
摘要: 【目的】为了准确地给专利申请书分配 IPC 分类号, 本文提出一种基于多特征多分类器集成的专利自动分 类方法。【方法】使用从专利申请书中提取的全词典 TFIDF 特征、信息增益词典 TFIDF 特征、段落向量特征、 主题模型向量特征, 分别训练朴素贝叶斯、支持向量机、AdaBoost 分类器, 以此构建特征–类别矩阵, 并结合 F1 权重矩阵集成, 获得最终 IPC 预测分类号。【结果】对 2014 年–2016 年“发动机或泵”领域的 10 个小类进行分 类, 使用 Top Prediction、All Categories 和 Two Guesses 三种评估方法得到准确率分别为: 78.9%、80.1%、91.2%。 【局限】训练仅仅使用了 2014 年–2016 年共三年的专利数据, 数据规模有限。【结论】在“发动机或泵”领域, 本文 方法能够有效地提高专利文本分类的准确率。
分类: 医学、药学 >> 临床医学 提交时间: 2022-08-17 合作期刊: 《中国全科医学》
摘要: 随着中国基层医疗的发展,近10年中国将培养近40万全科医生,其中培养具有胜任力的全科医生至关重要,这需要全科教育者探索大量适合中国且基于证据的全科教育理念、方法和内容。目前,国内全科教育干预研究的质量较差,大部分全科教育师资和研究者尚缺乏教育干预研究的相关培训。本文旨在介绍全科教育干预研究:从设计到发表的流程,将研究分为四个阶段,共13个步骤。四个阶段分别为研究准备(产生研究灵感、文献综述、融入理论/概念框架、精炼研究问题)、研究设计(试验设计、干预措施、结果评估)、研究执行(建立研究团队、获取研究资源、申请研究伦理、项目实施)、发表和评价阶段(文章撰写、反思与评价)。以期为全科教育研究者与实践者开展教育干预研究提供研究方法和思路,产生高质量的教育研究证据,进一步改善全科教育培训质量,培养具有胜任力的全科医生。