|簡體中文

比思論壇

 找回密碼
 按這成為會員
搜索



查看: 3|回復: 0
打印 上一主題 下一主題

基于深度神经网络的异常音频事件检测

[複製鏈接]

221

主題

1

好友

1217

積分

高中生

Rank: 4

  • TA的每日心情

    前天 20:18
  • 簽到天數: 300 天

    [LV.8]以壇為家I

    推廣值
    0
    貢獻值
    0
    金錢
    251
    威望
    1217
    主題
    221
    跳轉到指定樓層
    樓主
    發表於 前天 21:26 |只看該作者 |倒序瀏覽
    随着“中国制造 2025”计划的不断推进与发展,工业领域自动化、智能化、信息化和节能化需求不断增加,传统工业设备的转型升级成为该领域发展与建设的重点。声音是获取信息与传播信息的重要媒介,音频数据包含了丰富的信息。将声音通过数字化形式的接收、存储、处理以及分析是构建信息化社会最为基本的方式之一。因此,基于音频的工业设备异常自动检测逐渐成为人们关注的焦点。早期工业设备的故障检测是由具有长期工作经验的专家或者工程师通过自身工程经验对设备故障进行人工诊断。该过程需要大量的时间成本与相关人才培养成本,代价昂贵且效率较低。此外,实际工作环境中,异常发生较少,客观条件下难以收集详尽的异常信息,且由于工作环境的改变,在设备正常情况下采集到的音频的数据特征也可能不同,导致数据集存在域偏移。本文对国内外工业场景下机器设备异常检测方法进行了分析、研究与对比,对基于深度神经网络的异常音频事件检测方法及相关理论进行了重点研究。针对实际场景中,异常情况发生较少且难以及时采集数据的情况,通过对大量正常样本进行特征提取,利用自动编码器模型和分类网络模型进行异常检测;针对数据集存在的域偏移问题,使用机器类型与机器ID等简要信息对正常数据进行有监督训练,再提取模型高维特征,进行无监督异常检测。通过仿真实验对设计方法进行了验证,具体研究内容如下:(1) 针对机器故障诊断中异常数据少,且正常与异常的判断边界难以明确,验证了主流的基于自动编码器的异常音频事件检测方法。通过自编码器对机器正常声音的声学特征进行建模,通过待测音频特征和重建特征之间的误差值对机器声音进行异常检测。本文所提出的改进系统较基线系统改善了边缘帧的影响,且更好的捕捉音频时序信息,在DCASE2020任务2数据集上的平均性能较基线系统AUC提升了5.96%,pAUC提升了4.38%,较基线系统有更好的检测效果。(2) 利用有限的标签通过监督学习可以提取更好的数据特征,进而获得更好的决策效果。本文使用经典的分类网络对基于分类网络的异常音频事件检测方法进行验证,对比了不同模型之间的性能差异,并通过对多个训练好的模型进行融合,提高最终模型的泛化能力。(3) 针对数据集域偏移导致异常音频事件检测模型性能下降,提出了一种基于深度神经网络特征提取的异常音频事件检测方法。为了挖掘正常音频数据更加鲁棒的特性,首先通过有限的标签和利用人脸识别领域克服数据不平衡的损失函数来训练分类网络,再提取网络的某一层输出作为新的特征,最后进行无监督异常检测。在DCASE2021任务2数据集上,最佳模型相较于较基线1系统在AUC和pAUC指标上分别提升了13.37%和13.86%;较基线2系统在AUC和pAUC指标上分别提升了15.57%和10.23%。
    您需要登錄後才可以回帖 登錄 | 按這成為會員

    重要聲明:本論壇是以即時上載留言的方式運作,比思論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,讀者及用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,讀者及用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本論壇受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者及用戶發現有留言出現問題,請聯絡我們比思論壇有權刪除任何留言及拒絕任何人士上載留言 (刪除前或不會作事先警告及通知 ),同時亦有不刪除留言的權利,如有任何爭議,管理員擁有最終的詮釋權。用戶切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。

    手機版| 廣告聯繫

    GMT+8, 2025-1-9 04:46 , Processed in 0.027260 second(s), 16 queries , Gzip On, Memcache On.

    Powered by Discuz! X2.5

    © 2001-2012 Comsenz Inc.

    回頂部