【技術實現步驟摘要】
本專利技術涉及聲調識別
,特別涉及一種聲調評估方法。
技術介紹
隨著第二外語的大力推廣和普及,加之課堂教學模式(時間地點固定,人員數量多)和教師主觀測評(個體差異性大,穩定性差)存在的缺陷,急需一種更加便利和有效的手段,可以對外語學習者的發音質量進行及時有效的評估和反饋。CAPT(Computer-Aided Pronunciation Training,計算機輔助發音教學)為以上問題的解決提供了可能性,其以人機交互智能技術為媒介,幫助或引導學生進行發音練習的教學方法。在CAPT系統中,比較重要的一塊為“發音質量評價”,也就是計算機自動評估學習者發音的質量好壞,適合用于對發音者的整體語言發音能力進行評判,類似于教學中的考試環節。在過去的幾年里,CAPT系統中的“發音質量評價”研究取得了顯著進展,主要集中在“音段”層級上的評估和檢測。以漢語為例,由于其是“聲調”語言,“聲調”起到相當重要的詞義區分角色以及韻律相關作用,如外國留學生的“洋腔洋調”現象,不僅與“音段”的發音偏誤有關,而且與“聲調”的異常也有很大關系。因此,對于一個漢語CAPT系統,“聲調評測”也是非常關鍵的。而“聲調識別”又是“聲調評測”的基礎。對于標準語音,如果聲調識別系統的“調型”識別率很高,那么建立在該聲調識別技術基礎上的聲調評測系統就能準確地分辨出聲調的正確與否,從而比較可靠地評價出聲調發音的水平。在“孤立音節”中,標準的聲調發音基本符合其原有聲調模式,聲調評測可以根據是否符合聲調的標準模式進行評價。相對于“孤立音節”的聲調識別,在“連續語流”中,“聲調識別”是非常困難的,原因是 ...
【技術保護點】
一種聲調評估方法,其特征在于,包括:分別建立基于幀級別特征的聲調模型FLTM和基于音段級別特征的聲調模型SLTM;根據所述基于幀級別特征的聲調模型獲取待識別語音的平均幀級別后驗概率和對數后驗比;根據基于音段級別特征的聲調模型獲取所述待識別語音的音段層級對數后驗概率;根據所述平均幀級別后驗概率、所述對數后驗比以及所述音段層級對數后驗概率對所述待識別語音進行聲調評估。
【技術特征摘要】
1.一種聲調評估方法,其特征在于,包括:分別建立基于幀級別特征的聲調模型FLTM和基于音段級別特征的聲調模型SLTM;根據所述基于幀級別特征的聲調模型獲取待識別語音的平均幀級別后驗概率和對數后驗比;根據基于音段級別特征的聲調模型獲取所述待識別語音的音段層級對數后驗概率;根據所述平均幀級別后驗概率、所述對數后驗比以及所述音段層級對數后驗概率對所述待識別語音進行聲調評估。2.如權利要求1所述的聲調評估方法,其特征在于,所述根據所述基于幀級別特征的聲調模型獲取待識別語音的平均幀級別后驗概率和對數后驗比,包括:提取所述待識別語音的梅爾頻率倒譜系數MFCC特征以及基頻F0特征;基于提取的所述待識別語音的MFCC特征,利用深度神經網絡DNN分類器獲取所述待識別語音的發音特征;基于所述待識別語音的所述MFCC特征、所述基頻F0特征以及所述發音特征,利用深度神經網絡-隱馬爾可夫模型DNN-HMM獲取所述待識別語音的所述平均幀級別后驗概率和所述對數后驗比。3.如權利要求2所述的聲調評估方法,其特征在于,所述平均幀級別后驗概率由以下公式估計: A F L P ( p ) = l o g p ( p | o ; t s , t...
【專利技術屬性】
技術研發人員:張勁松,林舉,解焱陸,
申請(專利權)人:北京語言大學,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。