分类: 计算机科学 >> 计算机体系结构 提交时间: 2024-01-03
摘要: 无
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2024-01-07
摘要: 该中文命名实体识别项目的目标主要包括以下两个方面。首先是实现高精度的中文命名实体识别,通过对中文文本进行深度学习,提高中文实体识别的准确率,减少误识别和漏识别的现象。其次是实现标准化流程建立,形成一套标准化的中文命名实体识别流程,包括数据预处理、模型训练、实体识别等,为后续研究提供基础。代码提交在了GitHub,网址为https://github.com/Blue88888/DL_CNER。
分类: 信息科学与系统科学 >> 控制科学与技术 提交时间: 2024-01-13
摘要: 作为一个十余年来快速发展的崭新领域,深度学习受到了越来越多研究者的关注,它在特征提取和建模上都有着相较于浅层模型显然的优势.深度学习善于从原始输入数据中挖掘越来越抽象的特征表示,而这些表示具有良好的泛化能力.它克服了过去人工智能中被认为难以解决的一些问题。且随着训练数据集数量的显著增长以及芯片处理能力的剧增,它在目标检测和计算机视觉、自然语言处理、语音识别和语义分析等领域成效卓然,因此也促进了人工智能的发展.深度学习是包含多级非线性变换的层级机器学习方法。首先论述了深度学习的基础知识,分析了算法的优越性,并介绍了主流学习算法及应用现状。最后总结了当前存在的问题及发展方向。
分类: 其他 >> 综合 提交时间: 2023-03-31 合作期刊: 《农业图书情报学报》
摘要: [目的/ 意义]随着单细胞测序、高通量技术的突破,植物基因组学也取得了巨大进步,可以低成本获取多维全基因 组分子表型的海量数据。深度学习技术可以作为强大的数据挖掘工具对获取的分子表型进行进一步预测和解释。当前研究表 明,深度学习在植物基因组学与作物育种研究任务中取得显著效果。但目前尚缺乏对于深度学习在植物基因组学中应用的完 整综述。[方法/ 过程]本文首先概述了深度学习方法背景,包括最新的图神经网络;随后着重从基因特性、蛋白质特性方面 综述了基因组学和深度学习交叉领域的两个突出问题:1冤如何对从植物基因组DNA 序列到分子表型的信息流进行建模? 2冤如何使用深度学习模型识别自然种群中的功能变异?[结果/ 结论]本文总结了当前研究中如何应用传统深度学习算法、图 深度学习、生成对抗网络以及可解释性AI 等方法解决上述两个问题。最后分析了深度学习在未来植物基因组学研究和作物遗 传改良中的发展前景。
分类: 计算机科学 >> 自然语言理解与机器翻译 分类: 医学、药学 >> 中医学与中药学 提交时间: 2019-10-15
摘要: 本文在中医知识挖掘工作积累的基础上,对中医肺癌临床处方数据调研分析,针对其数据特点,构建深度学习模型挖掘处方中症状和中药之间隐藏关系等规律,在此过程中与医生沟通验证模型的准确性,最终实现处方智能生成并达到较高的临床有效性,辅助医生诊断,提升临床效率,推动临床诊断创新发展。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-06
摘要: 随着深度学习技术的蓬勃发展,其在图像分类领域的广泛应用为计算机视觉领域带来了革命性的变化。本文聚焦于深度学习在图像分类中的应用,以CIFAR-10数据集为基础,通过卷积神经网络(CNN)构建不同模型,对图像进行了分类精度评估。我还采用了ResNet等著名模型,对它们在CIFAR-10数据集上的分类性能进行了评估。为深入研究模型的特性,我们在实验中引入了不同的激活函数,并通过对比它们在分类任务中的表现,揭示了激活函数对模型性能的影响。此外,通过调整训练轮次等超参数,我们系统地研究了模型在不同训练轮次下的分类准确度。在实验中,我发现了训练的轮次并不是越多越好,可能会出现过拟合的现象,但是我通过调整模型,并增加Dropout 层在一定程度上解决了过拟合的问题,同时我通过模型的优化调整使得我的分类精度也得到了很大的提升,最高可达到0.7509。在不断的优化过程中,我对于深度学习在图像分类中的前景越来越有信心,我也将继续在这个方向不断深入研究。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]专利相似度检测(Similarity Measurement)可从宏观上辅助制定国家创新战略规划,发现国内外的热点及应对其他国家的专利流氓,从微观上为专利发明人、专利审查员、专利权人提供辅助支撑。[方法/过程]提出基于深度学习的Doc2Vec专利相似度分析方法,基于未进行清洗的专利语料库,采用深度学习的Doc2Vec模型,随机挑选了专利,研究了专利相似度检测问题,并和传统的相似度检测模型进行对比研究。[结果/结论]实验结果表明,基于深度学习的Doc2Vec模型和TF-IDF模型对于处理不做数据清洗的专利语料的结果有相近性,该方法对分析人员的专利领域知识要求较低,不需要对专利数据进行基于专利领域知识的数据清洗,同时可为专利侵权、专利查新提供新的智能工具支撑,降低研究门槛和工作量,提升研究效率。
分类: 其他 >> 综合 提交时间: 2024-03-28 合作期刊: 《文献与数据学报》
摘要: [目的 / 意义]指出《大规模现代汉语分词语料库构建及应用》一书的主要价值与贡献,旨在为中文语料库的构建提供借鉴,以促进大语言模型下中文自然语言处理的快速发展。[方法 / 过程]从宏观和微观的视角,对新时代人民日报分词语料库的构建和语料库相关研究综述进行了基于语料库计量语言学的分析,并对深度学习下的人民日报知识组织等内容进行了评介。[结果 / 结论]《大规模现代汉语分词语料库构建及应用》一书基于新时代人民日报分词语料库构建及应用进行研究,不仅传承了北京大学人民日报语料库的体系和理念,而且在一定程度上为解决领域化自然语言处理的任务提供了相应的方案。
分类: 信息科学与系统科学 >> 信息科学与系统科学基础学科 提交时间: 2024-01-06
摘要: 近年来工业过程向过程复杂化、规模大型化的方向发展,传统的故障诊断技术已在解决实际工业过程问题时,遇到了一系列难题。随着深度学习(deep learning)在特征提取与模式识别上的优异性能和独特潜力,深度学习技术被用于故障诊断已经成为当前研究的重点。为此本文介绍了几种典型的基于深度学习的故障诊断方法。最后对于深度学习在故障诊断应用中存在的障碍进行了探讨,并对展望了未来的相关研究方向。
分类: 数学 >> 控制和优化 提交时间: 2021-11-29
摘要: 在机器学习和数学优化研究领域, 深度学习优化问题易优性的数学解释极具挑战性. 损失函数存在高维、非凸、不光滑等特质性, 然而也能通过梯度下降法搜索到全局最优值. 损失函数地貌分析成为揭示深度学习优化问题易优性本质的重要研究方向. 为促进可解释、可信的深度学 习在更关键领域的应用, 本文回顾了损失函数地貌特征(局部极小点的数量和空间分布、最优点之间的连通性、临界点的最优性)、梯度下降法收敛性、以及损失函数地貌可视化等方面的研究进展和挑战.
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-28 合作期刊: 《计算机应用研究》
摘要: 近几年来,深度学习在语音识别、图像理解等许多应用领域取得了突破性成果。针对基于深度学习的静态人脸图像表情识别方法进行研究,首先介绍了深度学习的原理,并归纳了目前公开且常用的面部表情数据集;然后介绍了基于深度学习的表情识别的三个步骤,归纳了图像预处理和表情分类的主要方法,重点总结了目前性能较好用来提取特征的深度学习框架以及这些方法的基本原理和优劣势比较;最后指出了目前面部表情识别存在的问题和未来可能的发展趋势。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 随着视频分享应用和平台的蓬勃发展,视频数据正处于指数上升阶段,针对目前相似性视频检索方法中快速性和准确性仍无法满足用户要求等问题,提出了一种基于3D卷积神经网络的视频快速检索方法。该算法将3D卷积神经网络与哈希学习方法结合应用于视频数据,既能快速学习视频时空特征表示,又能极大地缩短视频检索时间。在常用视频数据集上的实验结果表明,利用所提出的方法对视频进行相似性检索性能优于当前主流方法。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2024-01-04
摘要: 通过对几篇论文的详细阅读与理解,我完成了本篇综述论文的撰写,并对图神经网络GNN及其部分变体,包括图卷积网络GCN、图采样神经网络GraphSAGE、注意力图神经网络GAT、图循环网络GGNN和图循环神经网络HGNN模型的基本概念、核心结构和应用领域进行了深入分析与全面研究,总结了这些论文作者的研究方法和他们研发的模型所实现的功能及应用,并给出了自己对于GNN未来的发展与研究方向的理解。
分类: 数学 >> 数学(综合) 提交时间: 2022-12-04
摘要: 本文通过严格数学分析找出了交叉熵过拟合的成因:边界样本的损失贡献比重大且随法向量增长而加速增大、边界样本分布散乱,顺便理清了正则项的作用机理。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-24 合作期刊: 《计算机应用研究》
摘要: 在海量音乐中,如何根据用户的历史收听记录分析用户需求以实现歌曲推荐是音乐推荐领域具有挑战性课题之一。现有的音乐推荐方法仅简单将用户听过的所有音乐均作为音乐推荐的上下文,导致不同类型音乐学习到的上下文权重分配相同,其严重影响了音乐推荐精度。针对此问题,提出了一种基于注意力机制的音乐深度推荐方法,针对不同用户的历史收听音乐动态分配不同的注意力,即学习出不同的上下文权重,使推荐结果更符合用户的实际偏好。通过在公开音乐数据集Million Song Dateset上的测试,所提方法的推荐准确率有很大的提升。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2024-01-08
摘要: 随着传感器和网络技术的飞速发展,大量历史时间序列数据出现,高效准确地进行时间序列预测越来越重要。近年来,将深度学习的思想和技术运用到时间序列预测任务中的方法发展迅速,并取得了许多成果。本文分析了时间序列预测方法的国内外研究现状,论述了时间序列预测所涉及的相关理论,归纳总结了该任务所运用的传统方法、基于机器学习的方法和基于深度学习的方法,重点对比分析了基于深度学习的各方法的优缺点,并由此对基于深度学习的时间序列预测方法进行了展望。
分类: 信息科学与系统科学 >> 信息科学与系统科学基础学科 提交时间: 2024-01-06
摘要: 虽然目前的基于单幅图像的三维人脸重建方法可以恢复精细的几何细节,但是这些方法具有局限性。某些方法生成的人脸无法真实地设置动画,因为它们没有对皱纹如何随表情变化进行建模。其他方法是在高质量的面部扫描上训练的,并且不能很好地推广到自然场景的图像。报告中使用的方法,能回归三维人脸形状和动画的细节,这些细节是特定于个人的但能随着表情的变化。该方法的模型经过训练,可以从由特定于人的细节参数和通用表情参数组成的低维潜在表示中鲁棒地生成UV位移图,而回归量则经过训练,可以从单个图像中预测细节,形状,表情,姿势和照明参数。为了实现这一点,该方法引入了一种新的细节一致性损失,从依赖于表情的皱纹中分离出特定于人的细节。这种解缠使得能够通过控制表情参数,同时保持个人特定细节不变,来合成逼真的个人特定皱纹。该方法是从自然场景得图像中学习的,没有配对的三维数据监督。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 力学其他学科 提交时间: 2023-06-15
摘要: 拓扑优化广泛应用于工程设计阶段,通过数学建模和优化设计空间中材料的分布来最大化产品性能。然而,解决拓扑优化问题的深度学习存在数据不足和训练模型边界条件适应性弱的问题。 因此,采用基于Topy库的数据样本生成方法,生成了随机结构、悬臂梁、连续梁和简支梁四种边界条件的400,000个二维样本,每种包含两类分辨率数据,并揭示了这一点数据集。提出了一种改进的 DoubleU-Net网络,用于实时高精度预测的拓扑优化。在生成的数据集中,随机梁、悬臂梁、连续梁和简支梁四种结构模型的平均IoU精度分别为93.26%、96.71%、96.35%和97.38%,实验结果表明 DoubleU-Net 可以更好地适应不同分辨率的数据。 使用随机结构数据集训练的模型泛化能力强,在大型项目实时结构优化方面具有巨大潜力。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 力学 >> 振动与波 提交时间: 2023-06-15
摘要: 本文基于膨胀残差卷积宽度网络提出一种模态分析的策略。在模态分析中,大规模结构或复杂系统的振动分析通常需要处理大量的数据和复杂的计算。采用膨胀残差卷积宽度架构可以降低网络的参数量和计算复杂度,减轻计算负担,提高分析的效率。膨胀残差卷积宽度网络应用于模态分析任务能够提升振动特征的提取能力、改善模态识别的准确性、增强结构损伤检测的敏感性,并且具有较高的计算效率和参数效率。实验结果表明,我们的模型在模态分析预测的回归任务中取得了优异的成绩。
分类: 天文学 >> 天文学 提交时间: 2023-06-07 合作期刊: 《天文学进展》
摘要: 深度学习用于引力波探测是近几年的研究热点。匹配滤波法可以看作模板存储于卷积核参数中的单卷积层的神经网络,通过加深模型的深度可以在参数大大减少的同时得到相似的探测效果。对不同的卷积核大小、卷积核的数量 (模型的宽度)、卷积层的数量 (模型的深度) 的深度学习引力波探测模型进行了讨论。另外,对全连接层前采用批量归一优化 (batch normalization, BN) 模型的探测效果进行了研究,发现单卷积层的模型在加入 BN 后的探测精度由 50% 左右提高到了 90% 以上。研究结果为匹配滤波模板数量的压缩提供了潜在的新方法,匹配滤波后通过BN 层和全连接层也许能够大大减少匹配模板数量。