基于多尺度注意力机制的高分辨率网络人体姿态估计

作者： 李丽 ¹ 张荣芬 ¹ 刘宇红 ¹ 陈娜 ¹ 张雯雯 ¹
作者单位：

1. 贵州大学大数据与信息工程学院
提交时间：2022-05-18 16:08:25

摘要: 针对人体姿态估计中面对特征图尺度变化的挑战时，难以预测人体的正确姿势，提出了一种基于多尺度注意力机制的高分辨率网络MSANet(multiscale-attention net)以提高人体姿态估计的检测精度。引入轻量级的金字塔卷积和注意力特征融合达到更高效的完成多尺度信息的提取；在并行子网的融合中引用自转换器模块进行特征增强，获取全局特征；在输出阶段中将各层的特征使用自适应空间特征融合策略进行融合后作为最后的输出，更充分的获取高层特征的语义信息和底层特征的细粒度特征，以推断不可见点和被遮挡的关键点。在公开数据集 COCO2017上进行测试，实验结果表明，该方法比基础网络HRNet的估计精度提升了4.2%。

人体姿态估计高分辨率网络多尺度注意力特征融合自适应空间特征融合

期刊： 计算机应用研究
分类： 计算机科学 >> 计算机科学的集成理论
引用： ChinaXiv:202205.00122 (或此版本 ChinaXiv:202205.00122V1)
DOI:10.12074/202205.00122V1
CSTR:32003.36.ChinaXiv.202205.00122.V1
推荐引用方式： 李丽,张荣芬,刘宇红,陈娜,张雯雯.(2022).基于多尺度注意力机制的高分辨率网络人体姿态估计.计算机应用研究.[ChinaXiv:202205.00122] (点此复制)

版本历史

[V1]

2022-05-18 16:08:25

ChinaXiv:202205.00122V1

下载全文

相关论文推荐

1. Turing’s thinking machine and ’t Hooft’s principle of superposition of states	2024-05-14
2. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
3. SteganoDDPM: A high-quality image steganography self-learning method using diffusion model	2024-04-23
4. 引导大语言模型生成计算机可解析内容	2024-04-21
5. 基于大语言模型的中英文整合复杂性建模研究	2024-04-10
6. 大模型与标准文献知识库的融合应用探索	2024-04-10
7. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
8. 引导大语言模型生成计算机可解析内容	2024-04-07
9. 基于 Python 中 MeCab 库对日语文章进行文本分析处理实现	2024-04-04
10. 一种基于能量-信息转换的智能测度	2024-03-30


公开评论匿名评论仅发给作者