分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 典籍是我国传统文化、思想和智慧的载体,结合数字人文的数据获取、标注和分析方法对典籍进行实体自动识别,对于后续应用研究具有重要意义。[方法/过程] 基于经过自动分词与人工标注的25本先秦典籍构建古籍语料库,分别基于不同规模的语料库和Bi-LSTM、Bi-LSTM-Attention、Bi-LSTM-CRF、Bi-LSTM-CRF-Attention、Bi-RNN和Bi-RNN-CRF、BERT等7种深度学习模型,从中抽取构成历史事件的相应实体并进行效果对比。[结果/结论] 在全部语料上训练得到的Bi-LSTM-Attention与Bi-RNN-CRF模型的准确率分别达到89.79%和89.33%,证实了深度学习应用于大规模文本数据集的可行性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-03-13
摘要: ChatGPT是由OpenAI公司研发的对话系统。它的对外表现是一个聊天机器人,实际本质是人工智能生成技术,关键基础是基于生成式预训练的变换器,核心技术是InstructGPT,主要特点是与前期类似产品相比,编造事实大幅下降,生成的毒内容更少。本文从ChatGPT的技术体系、相关研究与实践、应用情况等方面进行了系统的调研。分析了人工智能技术迅速发展带来的启示与ChatGPT对科学研究和文献情报工作的影响。提出了对文献情报领域的八条建议。总体来说,文献情报领域在AI时代要找到自己的不同价值取向,既要守正继承传统科学研究范式,也要拓展以ChatGPT等新技术助力科学研究。