分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-05-03
摘要: 近年来,迁移学习已经引起了广泛的关注。迁移学习是运用已存有的知识对不同但相关领域问题进行求解的新的一种机器学习方法。传统机器学习基于两个基本假设:(1) 用于学习的训练样本与新的测试样本满足独立同分布的条件;(2) 必须有足够可利用的训练样本才能学习得到一个好的分类模型。迁移学习降低了要求,目的是迁移已有的知识来解决目标领域中仅有少量或没有有标签样本数据时的学习问题。本文对迁移学习算法以及相关理论研究进展进行了综述,并介绍了我们在该领域所做的研究工作,特别是利用生成模型在概念层面建立迁移学习模型。最后指出了迁移学习下一步可能的研究方向。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2023-07-01
摘要: [目的] 本研究旨在提出一种基于词和词性的联合文本生成模型,以提高生成文本的质量。 [方法] 该模型由两个预训练的文本生成模型组成,一个是基于词的模型,另一个是基于词性的模型。此外,本文还提出并使用了BERT模型对进行二分类任务,以判断文本生成效果。 [结果] 在三个数据集上的实验结果表明,与传统的GPT模型相比,GPT-WP模型生成文本的质量有明显提升。 [局限] BERT模型在二分类任务中参数较大,大规模数据训练下评价效果差,本文提出的模型在数据量较小的场景下表现较好,大规模数据表现差异缩小。 [结论] GPT-WP模型在本文提出的评价方法下表明其能够有效地提高生成文本的质量,对于自然语言生成任务的改进和评估提供了参考。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-01-06
摘要: 扩散模型是一种强大的生成模型,能够在图像、文本和音频等多个领域内产生高质量的结果。本综述旨在汇总和分析应用于视觉领域的扩散生成模型的最新研究进展,包括该领域的理论和实践贡献。本文首先探讨了去噪扩散概率模型、基于分数的扩散生成模型和随机微分方程的扩散生成模型这三种主流模型的特点和原理,并分析了旨在优化模型内部算法和提高采样效率的相关衍生模型。其次,综合评述了扩散模型在当前的应用情况,包括在计算机视觉、自然语言处理、时间序列分析、多模态研究以及跨学科等多个领域的实际应用。最后,基于当前的研究趋势和挑战,对扩散模型未来的发展方向进行了展望,以期为该领域的研究提供指导和启发。本文旨在为研究人员提供一个关于扩散模型研究和应用的全面视图,强调其在人工智能生成内容(AIGC)领域的重要地位和未来潜力。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]由于微信公众平台提升了图书馆信息传播的智能化水平,增强了图书馆服务效能,已被我国图书馆作为重要的自媒体平台广泛应用。在此背景下,针对高校图书馆与公共图书馆微信公众平台进行比较研究具有重要意义。[方法/过程]首先,利用社交媒体大数据平台和网页爬虫技术对微信公众平台推文外部描述和推文内部描述数据进行采集,数据清洗后存储在mongo DB数据库中。其次,利用微信传播指数算法计算高校图书馆与公共图书馆微信公众平台传播指数。同时,引入机器学习中的文档主题生成模型(LDA)开展这两类图书馆微信公众平台推文文本的主题分类研究。最后,提出信息收受综合指数(IAAI)的概念与量化方法,并在设置IAAI阈值的条件下进行基于代表性推文特征指标统计的比较研究。[结果/结论]高校图书馆与公共图书馆微信公众平台阅读数与点赞数均存在密切正相关关系;高校图书馆公众平台传播影响力较公共图书馆稍低,但这两类图书馆都存在影响力两极分化现象;比较分析后找到高校图书馆与公共图书馆推文主题异同以及较高或较低信息收受综合指数推文的信息特征差异。最后根据研究结论提出针对这两类图书馆微信公众平台运营的建议。