您当前的位置: > 详细浏览

基于多层次注意力机制一维DenseNet的音频事件检测

请选择邀稿期刊:
摘要: 在音频事件检测任务中,目标音频易受背景噪声等因素的干扰,并且其在音频信号流中存在的比例不高,针对这些问题,提出一种多层次注意力机制一维DenseNet(dense convolutional network)音频事件检测模型。首先,使用一维DenseNet模型进行帧级检测能有效地检测音频事件发生的开始和结束时间;其次,在一维DenseNet模型中引入多层次注意力机制,这使得不同模块的感知特性随着网络层数的加深而自适应地变化。因此,模型可以在不同的网络层次自动选择和关注重要的目标帧而抑制不相关的背景帧。在DCASE 2017任务2的开发数据集上的实验表明,该方法的整体性能较传统的深度学习方法有进一步提高。

版本历史

[V1] 2019-05-10 10:28:40 ChinaXiv:201905.00038V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1981
  •  下载量957
评论
分享