您当前的位置: > 详细浏览

基于多尺度注意力机制的高分辨率网络人体姿态估计

请选择邀稿期刊:
摘要: 针对人体姿态估计中面对特征图尺度变化的挑战时,难以预测人体的正确姿势,提出了一种基于多尺度注意力机制的高分辨率网络MSANet(multiscale-attention net)以提高人体姿态估计的检测精度。引入轻量级的金字塔卷积和注意力特征融合达到更高效的完成多尺度信息的提取;在并行子网的融合中引用自转换器模块进行特征增强,获取全局特征;在输出阶段中将各层的特征使用自适应空间特征融合策略进行融合后作为最后的输出,更充分的获取高层特征的语义信息和底层特征的细粒度特征,以推断不可见点和被遮挡的关键点。在公开数据集 COCO2017上进行测试,实验结果表明,该方法比基础网络HRNet的估计精度提升了4.2%。

版本历史

[V1] 2022-05-18 16:08:25 ChinaXiv:202205.00122V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1035
  •  下载量438
评论
分享