您当前的位置: > 详细浏览

基于大语言模型的中英文整合复杂性建模研究

请选择邀稿期刊:

Integrative Complexity Modeling in English and Chinese Texts based on large language model

摘要: 整合复杂性是心理学中用来测量个体思维结构的一个概念,主要涉及两个方面:区分性和整合性。区分性是指个体能够识别和理解信息中存在的不同观点或元素的能力;整合性是指个体能够将这些不同的观点或元素合并成一个有逻辑性和连贯性的整体的能力。整合复杂性的测量主要依靠人工对于文本内容进行分析,这些文本可以是书面材料、演讲稿、面试记录或任何其他形式的口头或书面表达。针对当前整合复杂性人工测评方法成本高、自动化评估方法精度低以及缺乏中文文本评估方案等问题,本研究基于大语言模型文本数据增强技术和模型迁移技术为整合复杂性的评估设计了对于中英文文本的自动化评估方案,并探索了整合复杂性两种子结构:精细整合复杂性和辩证整合复杂性的自动化评估方法。本文设计并实施了两个研究,首先基于大语言模型文本数据增强技术实现了对于英文文本整合复杂性的预测模型,其次基于模型迁移技术实现了对于中文文本整合复杂性的预测模型。研究结果显示:1)使用GPT-3.5-Tubo对于英文文本数据进行增强,使用预训练多语言Roberta模型进行词向量提取,使用文本卷积神经网络模型作为下游模型。与人工标注相比,整合复杂性Spearman相关系数为0.62,辩证整合复杂性相关系数为0.51,精细整合复杂性Spearman相关系数为0.60。优于机器学习方法以及未经过数据增强的神经网络模型。2)本文在研究二中建立了与研究一中的神经网络结构一致的模型,并将研究一中最终的模型参数迁移至本研究的模型中,对于中文文本整合复杂性进行训练。在零样本的情况下,迁移学习模型整合复杂性Spearman相关系数为0.31,辩证整合复杂性Spearman相关系数为0.31,精细整合复杂性相关系数为0.33,均优于随机参数情况下的模型表现(整合复杂性:0.17,辩证整合复杂性:0.10,精细整合复杂性:0.10)。在小样本情况下迁移学习模型整合复杂性Spearman相关系数为0.73,辩证整合复杂性Spearman相关系数为0.51,精细整合复杂性相关系数为0.73。

版本历史

[V1] 2024-04-10 17:09:58 ChinaXiv:202404.00195V1 下载全文
点击下载全文
预览
同行评议状态
待评议
许可声明
metrics指标
  •  点击量353
  •  下载量93
评论
分享
申请专家评阅