您选择的条件: 吕璐成
  • 基于大模型知识蒸馏的专利技术功效词自动抽取方法研究:以车联网V2X领域为例

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-03-01

    摘要: 目的 本文旨在提高专利技术功效自动化提取的准确度。 方法 使用ChatGPT作为教师模型(Teacher-model),ChatGLM3作为学生模型(Student-model),通过知识蒸馏,将ChatGPT生成的训练数据微调ChatGLM3,得到多个技术词抽取模型和功效词抽取模型。采用多个技术词抽取模型分别从专利的摘要、第一权利要求和技术功效语段中抽取技术词,并采用功效词抽取模型从技术功效语段中抽取功效词。 结果 微调后的多个技术词抽取模型和功效词抽取模型相较于ChatGPT,在抽取技术词和功效词时呈现准确率高、召回率低的特点,第一权利要求的ChatGLM3微调模型的准确率和F1值最高,分别为0.734和0.724。功效词抽取模型抽取的功效词的准确率为0.649,大于商业工具标注功效词的准确率0.53。 局限 本研究的技术领域和专利语言单一,验证数据量偏小,数据清洗规则还有待于继续优化。 结论 本研究方案通过知识蒸馏操作,提升了大语言模型自动化抽取技术功效的准确性。同时,本研究能够支持从专利文本中挖掘前沿创新技术、热点技术,支撑更高质量的智能化专利分析。

  • 基于深度学习的中文专利自动分类方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升。[方法/过程] 针对传统机器学习方法存在的缺陷,基于Word2Vec、CNN、RNN、Attention机制等深度学习技术,考虑专利文本语序特征、上下文特征以及分类关键特征,设计Word2Vec+TextCNN、Word2Vec+GRU、Word2Vec+BiGRU、Word2Vec+BiGRU+TextCNN等7种深度学习模型,以中国专利为例,选取IPC主分类号的部作为分类依据,对比这7种模型与3种传统分类模型在中文专利分类任务中的效果。[结果/结论] 实证研究效果显示,采用考虑语序特征、上下文特征及强化关键特征的深度学习方法进行中文专利分类具有更优的分类效果。

  • “技术-功效”视角下的专利布局形势揭示与风险判定

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 掌握专利布局形势并判定当前面临的风险,对于有策略地进行专利布局和规避研发风险、抢占技术创新和产业升级竞争优势具有重要的意义。[方法/过程] 基于"技术-功效"矩阵,建立专利布局形势识别综合指标表达。通过综合判断与案例验证,形成普适的风险指标判断规则,以及当前专利布局风险的分析流程。基于"技术-功效"矩阵的专利布局形势图标可视化以及风险等级可视化的复合展现形式,直观展现专利布局形势与风险。[结果/结论] 落脚技术中观层面,形成基于"技术-功效"矩阵的专利布局形势的风险判定方法,有效揭示专利布局优势区、专利布局机会区、专利布局壁垒区和专利布局空白区,并进行应对策略探讨。该方法可从国家、区域、行业、机构、项目组、研发团队、个人等多个层面展开分析,支撑技术生命全周期的专利布局风险监测。

  • 基于专利数据的技术融合研究综述

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 基于专利数据开展技术融合研究是技术融合研究的主要方式和热点方向,面向为技术融合后续研究工作开展提供参考和启发的目标,对国内外基于专利数据的技术融合研究现状进行较为全面的综述。[方法/过程] 将已有研究按研究内容划分为技术融合测度及预测方法研究、特定领域/多领域间/全领域的技术融合态势测度及趋势预测、技术融合的测度指标研究、影响技术融合的特征因素研究、基于技术融合视角进行技术机会发现以及技术融合与创新的关系研究六类,并对各类别取得的研究成果进行评述。[结果/结论] 基于专利数据开展技术融合研究已经取得一定的成果,但是仍旧存在测度依据不合理、预测方法缺乏验证、全领域研究关注度低的问题,这些问题可通过引入语义关系优化技术融合网络、采用图神经网络技术改进技术融合预测方法、完善全领域技术融合测度和预测方法来解决。