您当前的位置:
首页 >
文章列表页 >
多模态跨级特征知识转移下音频目标检测网络
信息科学 | 更新时间:2024-02-01
    • 多模态跨级特征知识转移下音频目标检测网络

    • Audio object detection network with multimodal cross level feature knowledge transfer

    • 声音在目标检测领域的应用取得了新进展。针对当前仅通过监测环境声进行目标定位的方法鲁棒性较低的问题,专家提出了跨级特征知识转移下的多模态自监督目标检测网络。该网络不仅设计了基于注意力融合的多教师跨级特征知识转移损失,提高了网络的学习能力,还通过定位蒸馏损失解决了定位信息的缺失问题。在多模态视听检测MAVD数据集中的实验结果显示,该网络的mAP值在IOU值为0.5、0.75和平均的情况下较基线网络分别有6.71%、14.36%和10.32%的提升,证明了该检测网络的优越性。这一研究成果为声音在目标检测领域的应用提供了新的解决方案,也为相关领域的研究开辟了新的方向。
    • 光学精密工程   2024年32卷第2期 页码:237-251
    • DOI:10.37188/OPE.20243202.0237    

      中图分类号: TP394.1;TH691.9
    • 纸质出版日期:2024-01-25

      收稿日期:2023-06-08

      修回日期:2023-07-12

    扫 描 看 全 文

  • 刘诗蓓,陈莹.多模态跨级特征知识转移下音频目标检测网络[J].光学精密工程,2024,32(02):237-251. DOI: 10.37188/OPE.20243202.0237.

    LIU Shibei,CHEN Ying.Audio object detection network with multimodal cross level feature knowledge transfer[J].Optics and Precision Engineering,2024,32(02):237-251. DOI: 10.37188/OPE.20243202.0237.

  •  
  •  

0

浏览量

74

下载量

0

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

融合知识蒸馏和注意力机制的光伏热斑检测
重定位非极大值抑制算法
基于深度卷积神经网络的目标检测研究综述
面向工业目标检测的密集控制阀零件数据集
基于机器视觉的太阳能电池片缺陷检测算法综述

相关作者

郝帅
吴瑛琦
马旭
李彤
王海莹
苏树智
陈润斌
朱彦敏

相关机构

西安科技大学 电气与控制工程学院
安徽理工大学 计算机科学与工程学院
合肥综合性国家科学中心能源研究院(安徽省能源实验室)
安徽理工大学 机械工程学院
吉林大学 计算机科学与技术学院
0