为了解决全卷积孪生网络目标跟踪算法(SiamFC)在复杂环境下容易出现跟踪漂移甚至跟踪失败的问题,提出了一种基于难样本挖掘的孪生网络目标跟踪方法。该方法在SiamFC算法的基础上,首先利用特征融合模块进行特征融合,以提高特征表征的鲁棒性,然后引入一个新的损失函数,加强网络对难样本的学习能力并缓解正负样本不平衡的问题。为验证该方法的有效性,在OTB2015和GOT10k数据集上对算法进行测试实验。实验结果表明,在OTB2015数据集上该方法比SiamFC算法在成功率上提高2.6%,精度上提高2%在GOT10k数据集上该方法的mAO为0.429,相比SiamFC算法提高了3.7%,在光照变化、目标形变、相似背景干扰情况下具有更好的表现。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits4825, Downloads566, Comment 0
针对水底环境存在着可见度低、光照条件差、物种间特征差异不明显等问题,基于卷积神经网络,提出了一种新的非对称双分支水下生物分类模型。模型中交互分支利用不同的卷积神经网络中间层提取局部特征并通过交互模块对局部特征进行交互,增强分类模型的局部特征学习能力;卷积神经网络分支可以有效地学习到目标的全局特征,弥补交互分支中忽略的全局信息。在Fish4-Knowledge(F4K)、EILAT、RAMAS三个数据集上取得了98.9%、98.3%、97.9%的准确率,较前人方法有显著提高;视觉解释也验证了该模型可以有效地捕捉到局部特征并消除背景影响。最终显示,该模型在水下环境具有良好的分类性能。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits4756, Downloads541, Comment 0
画作的图像合成旨在将两个不同来源的图像分别作为前景和背景融合在一起,这通常需要局部风格迁移。现有的算法过程繁琐且耗时,不能做到实时的图像合成。针对这一缺点,提出了基于生成式对抗网络(GAN)的前向生成模型(PainterGAN)。PainterGAN的自注意力机制和U-net结构控制合成过程中前景的语义内容不变。同时,对抗学习保证逼真的风格迁移。在实验中,使用预训练模型作为PainterGAN的生成器,极大地节省了计算时间和成本。实验结果表明,比起已有的方法,PainterGAN生成了质量相近甚至更好的图像,生成速度也提升了400倍,在解决局部风格迁移问题上是高质量、高效率的。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits4875, Downloads530, Comment 0
针对多数单帧图像超分辨率(single image super-resolution,SISR)重建方法存在的特征信息发掘不充分、特征图各通道之间的相互依赖关系难以确定以及重建高分辨率(high resolution,HR)图像时存在重构误差等问题,提出了基于深度残差反投影注意力网络的图像超分辨率(SR)算法。即利用残差学习的思想缓解训练难度和充分发掘图像的特征信息,并使用反投影学习机制学习高低分辨图像之间的相互依赖关系,此外引入了注意力机制动态分配各特征图以不同的注意力资源从而发掘更多的高频信息和学习特征图各通道之间的依赖关系。实验结果表明了所提方法相比于多数单帧图像超分辨率方法,不仅在客观指标方面得到了显著的提升,而且重建的预测图像也具有更加丰富的纹理信息。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits4667, Downloads587, Comment 0
提出一种可预测判别K-SVD网络模型(DKSVDN)并用于人脸识别问题。该模型构造了一种新颖的字典结构,包含类别标签字典和描述字典,以兼顾判别和重构性能。相应的稀疏编码向量由标签编码向量和描述编码向量组成。针对样本稀疏编码时间效率低的问题,利用预测神经网络与判别字典学习模型协同训练的方法来加速预测稀疏编码。此外,针对DKSVDN还特别引入一种拟梦境的训练方法用于提升模型在训练集多样性不足时的鲁棒性。通过在主流人脸数据集上的对比实验证明了该模型的优良性能。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits4882, Downloads525, Comment 0
目前深度神经网络模型需要部署在资源受限的环境中,故需要设计高效紧凑的网络结构。本文针对设计紧凑的神经网络提出一种基于改进注意力迁移的模型压缩方法(KE),主要使用一个宽残差教师网络(WRN)指导一个紧凑的学生网络(KENet),将空间和通道的注意力迁移到学生网络来提升性能,并将该方法应用于实时目标检测。在CIFAR上的图像分类实验验证了经过改进注意力迁移的知识蒸馏方法能够提升紧凑模型的性能,在VOC上的目标检测实验验证了模型KEDet具有很好的精度(72.7mAP)和速度(86FPS)。实验结果充分说明基于改进注意力迁移的目标检测模型具有很好的准确性和实时性。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits4628, Downloads511, Comment 0
行人再识别主要是判断不同摄像机捕捉到的行人图像是否属于同一个人。现实生活中,由于人的姿势变化,摄像头的视角变化和背景干扰等因素,导致相同的行人在不同的摄像头产生巨大的差别,这是一项艰巨的任务。近几年,基于深度学习的方法在解决行人再识别问题都取得了显著的效果。然而目前多数方法仅将行人的局部或全局特征分开考虑,从而忽略了行人整体之间的关系,即行人全局特征和局部特征之间的联系。因此,该算法提出了一种增强特征融合网络(Enhanced Feature Convergent Network,EFCN)。在全局分支中,提出适用于获取全局特征的注意力网络作为嵌入特征,嵌入在基础网络模型中以提取行人的全局特征;在局部分支中,提出循环门单元变换网络(Gated Recurrent Unit Change Network,GRU-CN)得到代表性的局部特征,再使用特征融合方法将全局特征和局部特征融合成最终的行人特征,最后借助损失函数训练网络。通过大量的对比实验,该算法网络模型在标准的Re-ID数据集上可以获得较好的实验结果。提出的增强特征融合网络能提取辨别性较强的行人特征,该模型能够应用于大场景非重叠多摄像机下的行人再识别问题,具有较高的识别能力和识别精度,且对背景变化的行人图像能提取具有较强的鲁棒性特征。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits3719, Downloads397, Comment 0
针对双流法进行视频动作识别时忽略特征通道间的相互联系、特征存在大量冗余的时空信息等问题,提出一种基于双流时空注意力机制的端到端的动作识别模型T-STAM,实现了对视频关键时空信息的充分利用。首先,将通道注意力机制引入到双流基础网络中,通过对特征通道间的依赖关系进行建模来校准通道信息,提高特征的表达能力。其次,提出一种基于CNN的时间注意力模型,使用较少的参数学习每帧的注意力得分,重点关注运动幅度明显的帧。同时,提出一种多空间注意力模型,从不同角度计算每帧中各个位置的注意力得分,提取多个运动显著区域。接着,对时空特征进行融合进一步增强视频的特征表示。最后,将融合后的特征输入到分类网络,按不同权重融合两流输出得到动作识别结果。在数据集HMDB51和UCF101上的实验结果表明T-STAM能有效的识别视频中的动作。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits3822, Downloads526, Comment 0
为解决公共场所中人群分布不均以及目标尺度不一而影响人数估计的问题,提出了基于图像视野划分的公共场所人群计数模型。该模型首先将图像场景划分为远近视野两个区域:对近视野区域,使用基于YOLO的网络进行行人检测并通过添加场景约束避免在远近视野区域内重复计数;对远视野区域,使用改进的MobileNets提取人群密度分布特征,并引入超分辨率重建模块提升人群密度图质量,最终通过计算两者之和得到整幅图像中的人群数量。在Shanghai Tech和Mall数据集上进行测试,结果表明该模型在准确性和鲁棒性上有显著的提高。实验证明,模型切实可行。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits1762, Downloads353, Comment 0
针对图像重建过程中产生的边缘结构被破坏和纹理细节丢失问题,提出一种纹理细节和边缘结构保持的图像插值算法。首先,采用自适应阈值的八方向边缘检测划分图像区域;其次,构造双变量有理函数模型,它可在有理模型和多项式模型之间转换;最后提出基于边缘数据的局部不对称性和梯度特征调整待插值点空间距离的方法,调整边缘部分待插值点坐标并代入有理模型实现插值,而非边缘部分采用多项式模型插值。实验表明,该算法的峰值信噪比平均提升了0.48dB-2.17dB,结构相似性平均提升了0.004-0.028,获得了较高的客观评价数据。该算法将原空间距离不变的插值修正为空间距离变化的插值,有效地保持了图像的边缘结构和纹理细节,使得重建结果具有较好的视觉效果。 |
submitted time 2020-09-28 From cooperative journals:《计算机应用研究》 Hits1731, Downloads292, Comment 0