結合支持向量機二次識別的模糊核聚類語音情感識別方法。它先用梅爾倒譜系數,通過非線性核函數映射到高維特征空間,利用模糊核聚類得到聚類中心作為矢量量化的碼書,讓后通過平均模糊加權最小矢量量化誤差準則估計樣本類別標簽,估計完標簽后利用支持向量機法并用線性預測系數對高興和生氣進行二次識別。它是人機交互系統中自動識別情感的重要組成部分,它是機器與人進行有感情交互的第一步,對以人為設計中心的系統具有重要的應用前景。
【技術實現步驟摘要】
本專利技術屬于語音處理和人工智能交叉領域,特別涉及智能人機交互系統中的情感識別方法。
技術介紹
目前,基于傳統的統計方式的語音情感模式識別方法,又或者是諸如神經網絡的機器學習,這些傳統經典方法只有在樣本數據足夠大的時候才會取得理想的識別率,因此當實際中樣本數據較少或者有限時,傳統方法的工程應用將會受到限制。另外,眾所周知自然情感的表述以及所呈現的狀態經常是比較模棱兩可的或者說是混雜的(見文獻Emotion classification irom speech using evaluator reliability-weightedcombination of ranked—lists,Audhkhasi, K.,Narayanan, S.,In ICASS, Issue July,2011,pp :4956-4959.)。因此在設計語音情感識別系統是應當考慮到情感的混雜屬性,所以 以往的識別方法只是賦予未知情感一個單獨的預測標簽不是最優的(見文獻A Frameworkfor Automatic Human Emotion Classification Using Emotion Profiles, Emily M.,Narayanan, S. , IEEE Trans On Audio, Speech and Language Processing, 2011, vol.19,pp.1507-1520)。
技術實現思路
為解決上述問題,本專利技術中,我們利用模糊集理論知識,用模糊隸屬度來表征未知語音情感的模糊屬性,而非ー個單獨的分類預測標簽,從而更為合理;由于使用了模糊核非線性映射是不同情感的區分度増大。實驗結果也證明本專利技術中的提出的方法是有效的。首先利用模糊核聚類算法(見文獻A Kernel Method For Speaker RecognitionWith Little Data, Lin L.,Shuxun ff.,In ICSSP, 2006, vol. I)迭代出姆種情感的碼本,讓后利用平均模糊加權矢量量化誤差最小準則來分類未知語音的情感類別。基于模糊核矢量量化方法會出現陷入局部最優,從而出現識別率下降,針對高興和生氣在這種情況下易混淆,故而經過試驗驗證采用支持向量機(見文獻Chih-Chung C. , Chih-Jen Lin.LIBSV—A Library for Support Vector Machine. http://www. csie. ntu. edu. tw/ cjlin/libsvm/.)方法進行二次識別。其具體原理是核方法的基本思想是通過非線性映射將數據映射到高維特征空間,但是在高維空間中的計算是非常耗時的,因此實際中我們使用Mercer核來簡化計算。假設序列X= {xl,x2,...,xN}作為輸入數據,在特征空間中輸入數據可以表示為O(X1),i= N,這里①( )Rd — Rq, d << q是非線性映射,它可以用來求特征空間的內積,公式如下K(Xi, Xj) = (O (Xi)) ①(Xj)) (I)因為高斯核函數所對應的特征空間是無窮維的,那么有限的樣本在該特征空間中必然是線性可分的;另外,高斯核函數對噪聲的敏感程度遠遠低于其它核函數。因此,本專利技術中使用滿足Mercer條件的高斯核函數。在高斯核函數中,其中S 2表征的是離散度,在本文中利用樣本的方差O 2來表示該離散度,當特征樣本方差小,表示特征樣本矢量之間比較集中,這時候為了能夠得到好的分類,必須增大特征矢量的可區分性,由式(2)和(3)知,方差小,特征空間中樣本與各類矢量之間距離將增大,從而使得矢量之間可區分性增強,反之亦然。同時,當利用樣本方差O2來表示核函數中的離散度,無需為得到合適S 2而進行大量實驗,實現參數的自適應調整。新高斯核函數如下權利要求1.,包括1,非線性核函數映射;2,平均模糊加權最小矢量量化誤差準則;3,結合支持向量機二次識別。2.根據權利要求I所述的,其特征是1,使用梅爾倒譜系數,通過非線性核函數映射到高維特征空間,這樣既可以擴展不同情感的差異性而且也適用于不同數據分布結構的樣本;2,通過平均模糊加權最小矢量量化誤差準則估計樣本類別標簽,而非一個硬標簽更為合理,3,結合支持向量機對高興和生氣用線性預測系數進行二次識別,從而整體提高了識別率。全文摘要。它先用梅爾倒譜系數,通過非線性核函數映射到高維特征空間,利用模糊核聚類得到聚類中心作為矢量量化的碼書,讓后通過平均模糊加權最小矢量量化誤差準則估計樣本類別標簽,估計完標簽后利用支持向量機法并用線性預測系數對高興和生氣進行二次識別。它是人機交互系統中自動識別情感的重要組成部分,它是機器與人進行有感情交互的第一步,對以人為設計中心的系統具有重要的應用前景。文檔編號G06K9/62GK102663432SQ20121011397公開日2012年9月12日 申請日期2012年4月18日 優先權日2012年4月18日專利技術者何文洲, 徐斌, 王良翼, 黃杰 申請人:電子科技大學本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【專利技術屬性】
技術研發人員:黃杰,王良翼,徐斌,何文洲,
申請(專利權)人:電子科技大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。