System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理及金融科技領域,具體涉及一種音頻情感分類方法、裝置、計算機設備及計算機可讀存儲介質。
技術介紹
1、目前,隨著計算機技術的發展,越來越多的技術應用在金融領域,傳統金融業正在逐步向金融科技(fintech)轉變,音頻情感分類技術也不例外,例如,可將音頻情感分類技術應用于金融機構(如銀行等)相關的ai客服應用場景中,以提高ai客服對客戶的服務能力,但由于金融行業的安全性、實時性等要求,也對音頻情感分類技術提出了更高的要求。
2、當前,隨著人工智能技術的快速發展,音頻情感分類已成為一個重要的研究領域。音頻情感分類旨在自動識別和分類音頻信號中所表達的情感,這在智能客服、情感分析、健康監測等多個領域具有廣泛的應用前景。目前,業內常用的音頻情感分類方法主要包括以下兩種:
3、1、基于語音特征的方法:這種方法主要通過提取音頻信號的直接特征,如音調、音量、語速和語音質量等,來識別音頻中的情感,這些特征能夠直觀地反映語音信號的物理屬性,因此該方法操作簡單,易于實現;然而,由于情感的表達不僅僅局限于聲音的物理特征,還受到說話人的情緒狀態、語境等多種因素的影響,因此這種方法在情感分類的準確性和魯棒性方面存在一定的局限性;
4、2、基于語言模型的方法:這種方法利用自然語言處理(nlp)技術,對音頻信號進行語音識別和語義分析,以識別音頻中的情感,通過深入分析語言的內容和結構,這種方法能夠更準確地捕捉到情感的語義信息;但是,由于不同個體在口音、語氣等方面存在差異,這些差異可能會影響語音識別和語義分析
5、可知,在現有的音頻情感分類方法中,大多數方法都是直接輸入音頻信號進行處理,端到端的方法雖然簡化了分類流程,但相比于后端模型,其計算成本顯著增加。因此,如何可在保證音頻情感分類準確性的同時,降低計算成本,提高處理效率,是目前本領域技術人員亟待解決的問題。
技術實現思路
1、鑒于上述現有技術的不足之處,本專利技術的目的在于提供一種音頻情感分類方法、裝置、計算機設備及計算機可讀存儲介質,旨在解決如何可在保證音頻情感分類準確性的同時,降低計算成本,提高處理效率的問題。
2、為了達到上述目的,本專利技術采取了以下技術方案:
3、第一方面,本專利技術提供了一種音頻情感分類方法,其中,包括:
4、獲取待情感分類的目標音頻數據;
5、對所述目標音頻數據進行特征提取,得到mfcc特征;
6、計算所述mfcc特征的一階導數和二階導數,并將所述一階導數和所述二階導數與所述mfcc特征進行拼接,得到3d?mfcc特征;
7、基于所述3d?mfcc特征,通過音頻情感分類模型對所述目標音頻數據進行情感分類。
8、第二方面,本專利技術提供了一種音頻情感分類裝置,其中,包括:
9、數據獲取模塊,用于獲取待情感分類的目標音頻數據;
10、特征提取模塊,用于對所述目標音頻數據進行特征提取,得到mfcc特征;
11、計算與拼接模塊,用于計算所述mfcc特征的一階導數和二階導數,并將所述一階導數和所述二階導數與所述mfcc特征進行拼接,得到3d?mfcc特征;
12、情感分類模塊,用于基于所述3d?mfcc特征,通過音頻情感分類模型對所述目標音頻數據進行情感分類。
13、第三方面,本專利技術提供了一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其中,所述處理器執行所述計算機程序時實現如上所述的音頻情感分類方法。
14、第四方面,本專利技術提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其中,所述計算機程序被處理器執行時實現如上所述的音頻情感分類方法。
15、有益效果:相較于現有技術,本專利技術提供了一種音頻情感分類方法、裝置、計算機設備及計算機可讀存儲介質,其中,通過獲取待情感分類的目標音頻數據;對所述目標音頻數據進行特征提取,得到mfcc特征;計算所述mfcc特征的一階導數和二階導數,并將所述一階導數和所述二階導數與所述mfcc特征進行拼接,得到3d?mfcc特征;基于所述3d?mfcc特征,通過音頻情感分類模型對所述目標音頻數據進行情感分類。這樣,本專利技術通過先處理得到目標音頻數據的3d?mfcc特征,再通過音頻情感分類模型對于3d?mfcc特征的處理而實現對目標音頻數據的情感分類,從而本專利技術可在保證音頻情感分類準確性的同時,還可降低計算成本、提高處理效率。
本文檔來自技高網...【技術保護點】
1.一種音頻情感分類方法,其特征在于,包括:
2.根據權利要求1所述的音頻情感分類方法,其特征在于,所述獲取待情感分類的目標音頻數據,包括:
3.根據權利要求1所述的音頻情感分類方法,其特征在于,所述對所述目標音頻數據進行特征提取,得到MFCC特征,包括:
4.根據權利要求3所述的音頻情感分類方法,其特征在于,所述對所述目標音頻數據的每一幀進行短時傅里葉變換,得到短期功率譜,包括:
5.根據權利要求1所述的音頻情感分類方法,其特征在于,所述計算所述MFCC特征的一階導數和二階導數,并將所述一階導數和所述二階導數與所述MFCC特征進行拼接,得到3DMFCC特征,包括:
6.根據權利要求1-5任一項所述的音頻情感分類方法,其特征在于,所述基于所述3DMFCC特征,通過音頻情感分類模型對所述目標音頻數據進行情感分類,包括:
7.根據權利要求6所述的音頻情感分類方法,其特征在于,所述預先構建音頻情感分類模型,包括:
8.一種音頻情感分類裝置,其特征在于,包括:
9.一種計算機設備,包括存儲器、
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-7任一項所述的音頻情感分類方法。
...【技術特征摘要】
1.一種音頻情感分類方法,其特征在于,包括:
2.根據權利要求1所述的音頻情感分類方法,其特征在于,所述獲取待情感分類的目標音頻數據,包括:
3.根據權利要求1所述的音頻情感分類方法,其特征在于,所述對所述目標音頻數據進行特征提取,得到mfcc特征,包括:
4.根據權利要求3所述的音頻情感分類方法,其特征在于,所述對所述目標音頻數據的每一幀進行短時傅里葉變換,得到短期功率譜,包括:
5.根據權利要求1所述的音頻情感分類方法,其特征在于,所述計算所述mfcc特征的一階導數和二階導數,并將所述一階導數和所述二階導數與所述mfcc特征進行拼接,得到3dmfcc特征,包括:
6.根據權利要求1-5任一項...
【專利技術屬性】
技術研發人員:鄭喜民,蔣林軒,舒暢,陳又新,
申請(專利權)人:平安科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。