• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于深度神經網絡的語音情感識別方法技術

    技術編號:15507993 閱讀:95 留言:0更新日期:2017-06-04 02:27
    本發明專利技術公開了一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,該方法構建基于LSTM和CNN的語音情感識別系統,將語音序列作為系統的輸入,采用反向傳播算法對LSTM和CNN進行訓練,優化網絡的參數,得到優化后的網絡模型;利用已經訓練好的網絡模型對新輸入的語音序列進行情感分類,分為悲傷、高興、厭惡、恐懼、驚嚇、中性六種情感。該方法綜合考慮了LSTM和CNN兩種網絡模型,避免了人工選擇和提取特征的繁瑣,提高了情感識別的準確率。

    Speech emotion recognition method based on long and short time memory network and convolutional neural network

    The invention discloses a method of speech emotion recognition time and memory network based on convolutional neural network, the method of constructing speech emotion recognition system based on LSTM and CNN, the speech sequence as the input of the system is trained using back propagation algorithm of LSTM and CNN, the parameter optimization of the network, get the optimized network model use; speech sequence network model trained on the new input of emotion classification, divided into sadness, joy, disgust, fear, fear and neutral six emotions. This method takes into account the two network models of LSTM and CNN, avoids the complexity of manual selection and extraction of features, and improves the accuracy of emotion recognition.

    【技術實現步驟摘要】
    基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法
    本專利技術涉及圖像處理與模式識別領域,特別是基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法。
    技術介紹
    在人際交往中,存在包括語音、肢體語言、面部表情等在內的多種信息交換的方式。其中,語音信號是最快速的、最原始的交流方式,被研究學者認為是實現人機交互的最有效的方法之一。近半個世紀以來,學者們研究了大量的關于語音識別的課題,即如何將語音序列轉換為文本。盡管在語音識別方面取得重大進展,但是由于機器無法了解說話者的情感狀態,導致在實現人類和機器自然的交互方面還有很長的路要走。這也帶動了另一個方面的研究,就是如何從語音中識別出說話者的情感狀態,即語音情感識別。語音情感識別作為人機交互的一個重要分支,可以廣泛應用與教育、醫療、交通等各個領域。在車載系統中,可以用作對駕駛者的精神狀態進行監控,判斷其是否處于安全狀態,從而能在駕駛員疲勞的時候予以提醒,避免交通事故的發生;在電話服務中,可以用作對言辭表達激烈的用戶進行分揀,將其轉接給人工客服,優化用戶體驗,提高整個服務水平;在臨床醫學中,借助語音情感識別對抑郁癥患者或者自閉癥兒童的情感變化進行跟蹤,作為疾病診斷和輔助治療的工具;在機器人研究中,幫助機器人利用語音信息理解人的感情,做出友好且智能的回應,實現交互。現階段大部分語音情感識別的方法均采用傳統提取特征,再用分類器進行分類的方法。常用的語音特征包括基音、語速、強度(韻律特征)、線性預測倒譜系數、梅爾頻率倒譜系數(頻譜特征)等。常用的分類方法包括隱馬爾可夫模型,支持向量機,高斯混合模型。傳統的情感識別方法已經趨于成熟,但是仍存在一定的不足。比如,目前尚不明確哪種特征對情感識別的影響最大,大多數實驗中只選用一種特征作為判斷的依據,降低了情感識別的客觀性。另外,現有的一些特征中,比如基音、語速等韻律特征受說話者的風格影響較大,增加了識別的復雜度。隨著近階段深度學習的發展,不少研究者選擇采用訓練網絡模型來完成情感識別。現有的語音情感識別方法中,主要有基于深度信念網絡的語音情感識別方法,基于長短時間記憶網絡的語音情感識別方法和基于卷積神經網絡的語音情感識別方法。上述三種方法中,存在的主要缺點是:無法兼顧各個網絡模型的優點。比如,深度信念網絡可以將一維序列用作輸入,但是無法利用序列前后間的相關性;長短時間記憶網絡雖然能夠利用序列前后間的相關性,但是提取的特征維數較高;卷積神經網絡無法直接對語音序列進行處理,需先對語音信號進行傅里葉變換,將其轉換為頻譜后作為輸入。傳統的語音情感識別方法在特征提取和分類發展前景小,以及現有的基于深度學習的語音情感方法網絡較為單一。
    技術實現思路
    本專利技術所要解決的技術問題是克服現有技術的不足,而提供基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,避免了人工提取和篩選特征的復雜過程,通過訓練網絡自適應的調整參數,獲得最佳的情感識別效果。本專利技術為解決上述技術問題采用以下技術方案:根據本專利技術所述的一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,包括以下步驟:步驟A、對語音情感數據庫中的語音樣本進行預處理操作,使得每個語音樣本均能用一個等長的序列表示,從而得到預處理后的語音序列;步驟B、構建基于長短時間記憶網絡LSTM和卷積神經網絡CNN的語音情感識別系統,其包含兩個基本模塊:長短時間記憶網絡模塊和卷積神經網絡模塊;步驟C、將預處理后的語音序列依次送入語音情感識別系統進行多次訓練,利用反向傳播算法調整LSTM和CNN的參數,獲得優化后的網絡模型;步驟D、利用步驟C訓練得到的網絡模型對新輸入的語音序列進行情感分類,分為悲傷、高興、厭惡、恐懼、驚嚇、中性六種情感。作為本專利技術所述的一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法進一步優化方案,所述步驟B中的長短時間記憶網絡模塊,具體構建步驟如下:B1.1、設定語音樣本序列的長度為m,m=n×n,n為正整數,設定當前時刻遺忘門單元和輸入門單元的輸出分別為ft和it,滿足:ft=σ(Wf·xc+bf)it=σ(Wi·xc+bi)其中,xc=[ht-1,xt],新向量xc是將兩個ht-1、xt向量首尾相連得到的,xt為當前時刻的輸入,ht-1為前一時刻隱藏層的狀態,xc為連接后的新向量,Wf和Wi分別為遺忘門單元和輸入門單元的權值矩陣,bf和bi分別為遺忘門單元和輸入門單元的偏置向量,σ(·)為sigmoid激勵函數;B1.2、通過下式計算得出當前細胞狀態Ct的值:其中,Ct-1為前一時刻細胞狀態,為當前時刻細胞狀態的參考值,WC為細胞狀態的權值矩陣,bC為細胞狀態的偏置向量,tanh(·)為雙曲正切函數;B1.3、根據下式得到各個隱藏節點的輸出ht,將ht依次連接,構成m維的特征向量;ht=ot*tanh(Ct)ot=σ(Wo·[ht-1,xt]+bo)其中,Wo為輸出門單元的權值矩陣,bo為輸出門單元的偏置向量,ot為輸出門單元的輸出。作為本專利技術所述的一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法進一步優化方案,所述步驟B中的卷積神經網絡模塊,具體構建步驟如下:B2.1、將步驟B1.3中提取的m維的特征向量轉換為n×n的特征矩陣作為卷積神經網絡的輸入;B2.2、卷積神經網絡的第一層為卷積層,選用m1個k1×k1維的卷積核對輸入數據進行卷積運算,卷積步長為s1,卷積后的結果再經過激勵函數進行非線性映射,得到卷積層的輸出即m1個l1×l1維的特征圖;B2.3卷積神經網絡的第二層為池化層,選用m2個k2×k2維的卷積核,對第一層卷積層輸出的特征圖進行步長為s2的池化,得到池化層的輸出即m2個l2×l2維的特征圖;B2.4、卷積神經網絡的第三層為卷積層,選用m3個k3×k3維的卷積核,對第二層池化層輸出的特征圖進行卷積運算,卷積后的結果再經過激勵函數進行非線性映射,得到卷積層的輸出即m3個l3×l3維的特征圖;B2.5、卷積神經網絡的第四層為卷積層,選用m4個k4×k4維的卷積核,對第三層卷積層輸出的特征圖進行卷積運算,卷積后的結果再經過激勵函數進行非線性映射,得到卷積層的輸出即m4個l4×l4維的特征圖;B2.6、卷積神經網絡的第五層為卷積層,選用m5個k5×k5維的卷積核,對第四層卷積層輸出的特征圖進行卷積運算,卷積后的結果再經過激勵函數進行非線性映射,得到卷積層的輸出即m5個l5×l5維的特征圖;B2.7、卷積神經網絡的第六層為池化層,選用m6個k6×k6維的卷積核,對第五層卷積層輸出的特征圖進行步長為s6的池化,得到池化層的輸出即m6個l6×l6維的特征圖;B2.8、卷積神經網絡的第七、八、九層為全連接層;其中,第七層是將第六層池化層輸出的特征圖全連接到本層的c個節點;第八層對第七層的c個節點進行ReLU函數非線性變換后,然后利用dropout方法控制隱藏層節點的連接權重,全連接數目為c個;第九層全連接層輸出節點為p個,輸出為融合了特征標簽的softmax損失。作為本專利技術所述的一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法進一步優化方案,所述步驟B中的卷積神經網絡的softmax損失的函數J(θ)定義如下:其中,x(i)為輸入向量,y(i)為輸入向量對本文檔來自技高網
    ...
    <a  title="基于深度神經網絡的語音情感識別方法原文來自X技術">基于深度神經網絡的語音情感識別方法</a>

    【技術保護點】
    一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,其特征在于,包括以下步驟:步驟A、對語音情感數據庫中的語音樣本進行預處理操作,使得每個語音樣本均能用一個等長的序列表示,從而得到預處理后的語音序列;步驟B、構建基于長短時間記憶網絡LSTM和卷積神經網絡CNN的語音情感識別系統,其包含兩個基本模塊:長短時間記憶網絡模塊和卷積神經網絡模塊;步驟C、將預處理后的語音序列依次送入語音情感識別系統進行多次訓練,利用反向傳播算法調整LSTM和CNN的參數,獲得優化后的網絡模型;步驟D、利用步驟C訓練得到的網絡模型對新輸入的語音序列進行情感分類,分為悲傷、高興、厭惡、恐懼、驚嚇、中性六種情感。

    【技術特征摘要】
    1.一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,其特征在于,包括以下步驟:步驟A、對語音情感數據庫中的語音樣本進行預處理操作,使得每個語音樣本均能用一個等長的序列表示,從而得到預處理后的語音序列;步驟B、構建基于長短時間記憶網絡LSTM和卷積神經網絡CNN的語音情感識別系統,其包含兩個基本模塊:長短時間記憶網絡模塊和卷積神經網絡模塊;步驟C、將預處理后的語音序列依次送入語音情感識別系統進行多次訓練,利用反向傳播算法調整LSTM和CNN的參數,獲得優化后的網絡模型;步驟D、利用步驟C訓練得到的網絡模型對新輸入的語音序列進行情感分類,分為悲傷、高興、厭惡、恐懼、驚嚇、中性六種情感。2.根據權利要求1所述的一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,其特征在于,所述步驟B中的長短時間記憶網絡模塊,具體構建步驟如下:B1.1、設定語音樣本序列的長度為m,m=n×n,n為正整數,設定當前時刻遺忘門單元和輸入門單元的輸出分別為ft和it,滿足:ft=σ(Wf·xc+bf)it=σ(Wi·xc+bi)其中,xc=[ht-1,xt],新向量xc是將兩個ht-1、xt向量首尾相連得到的,xt為當前時刻的輸入,ht-1為前一時刻隱藏層的狀態,xc為連接后的新向量,Wf和Wi分別為遺忘門單元和輸入門單元的權值矩陣,bf和bi分別為遺忘門單元和輸入門單元的偏置向量,σ(·)為sigmoid激勵函數;B1.2、通過下式計算得出當前細胞狀態Ct的值:其中,Ct-1為前一時刻細胞狀態,為當前時刻細胞狀態的參考值,WC為細胞狀態的權值矩陣,bC為細胞狀態的偏置向量,tanh(·)為雙曲正切函數;B1.3、根據下式得到各個隱藏節點的輸出ht,將ht依次連接,構成m維的特征向量;ht=ot*tanh(Ct)ot=σ(Wo·[ht-1,xt]+bo)其中,Wo為輸出門單元的權值矩陣,bo為輸出門單元的偏置向量,ot為輸出門單元的輸出。3.根據權利要求2所述的一種基于長短時間記憶網絡和卷積神經網絡的語音情感識別方法,其特征在于,所述步驟B中的卷積神經網絡模塊,具體構建步驟如下:B2.1、將步驟B1.3中提取的m維的特征向量轉換為n×n的特征矩陣作為卷積神經網絡的輸入;B2.2、卷積神經網絡的第一層為卷積層,選用m1個k1×k1維的卷積核對輸入數據進行卷積運算,卷積步長為s1,卷積后的結果再經過激勵函數...

    【專利技術屬性】
    技術研發人員:袁亮盧官明閆靜杰
    申請(專利權)人:南京郵電大學
    類型:發明
    國別省市:江蘇,32

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久精品aⅴ无码中文字字幕重口| 国产精品无码专区| 久久无码人妻一区二区三区午夜| 亚洲va中文字幕无码久久不卡| 无码专区人妻系列日韩精品少妇| 蕾丝av无码专区在线观看| 久久无码专区国产精品| 午夜无码一区二区三区在线观看 | 日韩精品人妻系列无码专区免费| 亚洲精品久久无码| 午夜无码A级毛片免费视频| 成人免费无码精品国产电影| 精品亚洲A∨无码一区二区三区| 国产精品无码一区二区在线观一 | 亚洲视频无码高清在线| 韩国19禁无遮挡啪啪无码网站| 亚洲av无码专区在线观看亚| 日韩精品无码一区二区中文字幕| 国产精品无码专区在线观看| 国产精品成人一区无码| 无码狠狠躁久久久久久久| 无码人妻精品一区二区三| 亚洲啪啪AV无码片| 亚洲午夜福利精品无码| 少妇人妻av无码专区| 亚洲av成人无码网站…| 亚洲AV永久无码天堂影院| 亚洲性无码一区二区三区| 精品人妻大屁股白浆无码| 人妻无码一区二区三区免费| 无码人妻丰满熟妇区免费| 日韩一区二区三区无码影院| 欧洲人妻丰满av无码久久不卡 | 中文字幕久久精品无码| 伊人久久精品无码二区麻豆| 国产亚洲精久久久久久无码77777| 亚洲男人在线无码视频| 免费无码黄网站在线看| 亚洲av无码片在线播放| 人妻夜夜添夜夜无码AV| 亚洲av成人中文无码专区|