System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及數據處理,尤其涉及一種音頻噪聲檢測模型的訓練方法、音頻噪聲檢測方法及裝置。
技術介紹
1、在計算機硬件的制造過程中,音頻信號傳輸線路與電源單元電纜等布線之間可能會存在電磁干擾。這種干擾會導致音頻輸出中存在噪聲,即底噪,從而影響音頻質量,影響使用體驗。針對該問題,目前的檢測方法為,首先人工將耳機插入設備,然后通過人的聽覺判斷音頻輸出中是否存在底噪。或者是使用專業設備模擬人耳進行測試。人的聽覺依賴主觀因素,檢測精度和效率都容易受到影響。而專業設備價格昂貴,且需要專業技術人員操作。
技術實現思路
1、本公開提供一種音頻噪聲檢測模型的訓練方法、音頻噪聲檢測方法及裝置,以至少解決現有技術中存在的以上技術問題。
2、根據本公開的第一方面,提供了一種音頻噪聲檢測模型的訓練方法,所述方法包括:獲取多個音頻數據;對所述音頻數據進行聲音特征提取,獲得所述音頻數據的頻域特征、短時噪聲能量和a加權聲壓級;對所述頻域特征、所述短時噪聲能量和所述a加權聲壓級進行融合,獲得所述音頻數據對應的綜合特征向量;基于所述綜合特征向量對原始自監督學習模型進行訓練,獲得音頻噪聲檢測模型。
3、在一可實施方式中,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的頻域特征,包括:對所述音頻數據進行頻域轉換,得到頻域信號;基于所述頻域信號的能量分布,確定所述音頻數據的頻域特征。
4、在一可實施方式中,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的短時噪聲能量,包括:對所述音頻數據
5、在一可實施方式中,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的a加權聲壓級,包括:對所述音頻數據進行加權處理,得到加權后的音頻數據;確定所述加權后的音頻數據的均方根值;基于所述均方根值,對所述加權后的音頻數據進行聲壓級提取,得到所述音頻數據的a加權聲壓級。
6、在一可實施方式中,所述對所述頻域特征、所述短時噪聲能量和所述a加權聲壓級進行融合,獲得所述音頻數據對應的綜合特征向量,包括:確定頻域特征、短時噪聲能量和a加權聲壓級各自對應的加權系數;基于所述加權系數,對頻域特征、短時噪聲能量和a加權聲壓級進行加權融合,得到所述音頻數據對應的綜合特征向量。
7、在一可實施方式中,所述基于所述綜合特征向量對原始自監督學習模型進行訓練,獲得音頻噪聲檢測模型,包括:基于所述綜合特征向量對原始自監督學習模型進行微調,獲得微調后的原始自監督學習模型;對所述微調后的原始自監督學習模型的學習率進行調整,獲得音頻噪聲檢測模型。
8、在一可實施方式中,所述多個音頻數據中包括虛擬負樣本數據,所述獲取多個音頻數據包括:獲取真實樣本數據;對所述真實樣本數據中的真實負樣本數據進行數據增強,得到虛擬負樣本數據;基于所述真實樣本數據和所述虛擬負樣本數據,得到多個音頻數據。
9、根據本公開的第二方面,提供了一種音頻噪聲檢測方法,所述方法包括:獲取待檢測音頻數據;將所述待檢測音頻數據輸入至音頻噪聲檢測模型,得到檢測結果,所述音頻噪聲檢測模型由上述實施方式所述方法訓練而成。
10、根據本公開的第三方面,提供了一種音頻噪聲檢測裝置,所述裝置包括:音頻獲取模塊,用于獲取待檢測音頻數據;音頻檢測模塊,用于將所述待檢測音頻數據輸入至音頻噪聲檢測模型,得到檢測結果,所述音頻噪聲檢測模型由上述實施方式所述方法訓練而成。
11、本公開的一種音頻噪聲檢測模型的訓練方法,該方法首先獲取多個音頻數據。然后對所述音頻數據進行聲音特征提取,獲得所述音頻數據的頻域特征、短時噪聲能量和a加權聲壓級。再對三者進行融合,獲得所述音頻數據對應的綜合特征向量。最后基于所述綜合特征向量對原始自監督學習模型進行訓練,獲得音頻噪聲檢測模型。本公開通過提取多維度特征,形成綜合特征向量,使模型能夠更全面地捕捉到聲音的特征,從而提高噪聲檢測的準確性。采用自監督學習模型,可以利用未進行標記的音頻數據進行訓練,從而降低數據標準的成本和難度。
12、應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網...【技術保護點】
1.一種音頻噪聲檢測模型的訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的頻域特征,包括:
3.根據權利要求1所述的方法,其特征在于,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的短時噪聲能量,包括:
4.根據權利要求1所述的方法,其特征在于,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的A加權聲壓級,包括:
5.根據權利要求1所述的方法,其特征在于,所述對所述頻域特征、所述短時噪聲能量和所述A加權聲壓級進行融合,獲得所述音頻數據對應的綜合特征向量,包括:
6.根據權利要求1所述的方法,其特征在于,所述基于所述綜合特征向量對原始自監督學習模型進行訓練,獲得音頻噪聲檢測模型,包括:
7.根據權利要求1所述的方法,其特征在于,所述多個音頻數據中包括虛擬負樣本數據,所述獲取多個音頻數據,包括:
8.一種音頻噪聲檢測方法,其特征在于,所述方法包括:
9.一種音頻噪聲檢測裝置,其特征在于,所述裝置部署有音頻
10.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其特征在于,所述計算機指令用于使計算機執行根據權利要求1-7中任一項所述的方法。
...【技術特征摘要】
1.一種音頻噪聲檢測模型的訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的頻域特征,包括:
3.根據權利要求1所述的方法,其特征在于,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的短時噪聲能量,包括:
4.根據權利要求1所述的方法,其特征在于,對所述音頻數據進行聲音特征提取,獲得所述音頻數據的a加權聲壓級,包括:
5.根據權利要求1所述的方法,其特征在于,所述對所述頻域特征、所述短時噪聲能量和所述a加權聲壓級進行融合,獲得所述音頻數據對應的綜合特征...
【專利技術屬性】
技術研發人員:韓富康,屠恩波,楊興龍,應健,慎雪,李軍士,
申請(專利權)人:合肥聯寶信息技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。