System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及語音信號處理,具體涉及一種語音處理的普通話訓練矯正方法。
技術介紹
1、普通話作為一種標準語音,在交流和教育中具有重要意義。然而,由于方言影響、地域差異和個人語音習慣,許多人在普通話發音中存在不同程度的語音偏差。
2、傳統的語音糾正方法主要依賴于人工教學,教師需要逐字逐音地糾正學習者地發音,這種方式不僅耗時費力,而且缺乏個性化和精準性。
3、目前,基于語音識別的普通話訓練矯正技術已經取得了一定的發展,但在精確捕捉和分析個人語音細微偏差方面仍然存在局限性。特別是對于聲母和韻母這些具體音節的識別和矯正,現有技術往往無能為力。這種局限性導致許多普通話學習者難以有效地改進自身的發音問題,阻礙了語言交流的流暢性和準確性。
技術實現思路
1、針對現有技術中的上述不足,本專利技術提供的一種語音處理的普通話訓練矯正方法解決了當前技術在精確捕捉和分析個人語音細微偏差方面存在局限性,無法針對聲母和韻母這些具體音節進行識別和矯正的問題。
2、為了達到上述專利技術目的,本專利技術采用的技術方案為:
3、一種語音處理的普通話訓練矯正方法,包括以下步驟:
4、s1、錄取用戶朗讀訓練文本時的語音,經過切分、模數轉換、能量歸一化處理和頻域分析,得到各個朗讀字音幅頻特征序列;
5、s2、分析每個朗讀字音幅頻特征序列中的各個幅度峰的頻率,構建對應的朗讀字音韻母特征向量,并分析每個朗讀字音幅頻特征序列的包絡線,構建對應的朗讀字音聲母特
6、s3、對比每個朗讀字音與標準普通話字音的韻母特征向量的頻偏和走勢差異,檢出用戶不標準的韻母音節;
7、s4、分級對比每個朗讀字音與標準普通話字音的聲母特征向量,檢出用戶不標準的聲母音節;
8、s5、根據所述s3和s4檢出的不標準音節,提示用戶,并向用戶播報對應的標準普通話音節發音和拼讀方法,以訓練和矯正用戶的普通話。
9、本專利技術的有益效果為:本專利技術針對用戶的字音,通過頻域分析,基于聲母和韻母不同的特性,對用戶具體音節進行精準捕捉和細致識別,有效地指出了用戶發音和拼讀的問題,使得用戶普通話的訓練和矯正更加高效和精準,對提升民眾語言能力和交流水平具有重要意義。
10、進一步地,所述s1包括以下分步驟:
11、s11、錄取用戶勻速朗讀訓練文本時的語音,得到朗讀語音電信號,并根據訓練文本的字數,將其切分為多個朗讀字音電信號,每個朗讀字音電信號的時間長度均為:
12、,
13、其中,τ為朗讀字音電信號的時間長度,t為朗讀語音電信號的時間長度,l為訓練文本的字數;
14、s12、將各個朗讀字音電信號由模擬信號轉化為數字信號序列,并通過下式的能量歸一化處理,得到各個朗讀字音時域特征序列:
15、,
16、其中,si(k)為第i個朗讀字音時域特征序列第k個元素的值,為第i個朗讀字音在歸一化前數字信號序列第k個元素的值,m為朗讀字音電信號在模擬數字轉換時的采樣點數目;
17、s13、計算與各個朗讀字音時域特征序列相對應的幅頻特征序列。
18、進一步地,所述s13包括以下分步驟:
19、s131、根據各個朗讀字音時域特征序列,通過快速傅里葉變換fft,計算得到各個朗讀字音復頻域序列;
20、s132、通過下式,根據各個朗讀字音復頻域序列,計算各個朗讀字音幅頻序列:
21、,
22、其中,為第i個朗讀字音幅頻序列第n個元素的幅度值,ri(n)為第i個朗讀字音復頻域序列第n元素的實部,ji(n)為第i個朗讀字音復頻域序列第n元素的虛部;
23、s133、通過下式,對各個朗讀字音幅頻序列進行用于增強辨識度的非線性變換,得到各個朗讀字音幅頻特征序列:
24、,
25、其中,pi(n)為第i個朗讀字音幅頻特征序列第n個元素的幅度值,γ為增益系數,log10為以10為底的對數函數,bias為偏置系數。
26、上述進一步方案的有益效果為:針對每個字音進行分析處理,避免字與字的串擾;能量歸一化處理,避免了用戶聲音大小的不同對字音識別造成的影響;幅頻序列的非線性變換式,是單調遞增函數,不僅保障了原有大小規律,還放大了近零點的差異有效增強了辨識度。
27、進一步地,所述s2中,分析每個朗讀字音幅頻特征序列中的各個幅度峰的頻率,構建對應的朗讀字音韻母特征向量的過程,均包括以下步驟:
28、a1、在朗讀字音幅頻特征序列中的前m/2個元素中,找出幅度值從高到低的前n個元素,記錄其在朗讀字音幅頻特征序列中的序號,m為朗讀字音電信號在模擬數字轉換時的采樣點數目;
29、a2、根據所述a1記錄的各元素在朗讀字音幅頻特征序列中的序號,通過下式,計算得到對應元素的頻率:
30、,
31、其中,fx為朗讀字音幅頻特征序列內幅度值第x高的元素的頻率,fs為模擬數字轉換時的采樣頻率,nx為朗讀字音幅頻特征序列內幅度值第x高的元素在朗讀字音幅頻特征序列中序號,x為小于等于n的正整數;
32、a3、按對應幅度值從高到低的順序,拼接所述n個元素的頻率,構成韻母特征向量。
33、上述進一步方案的有益效果為:韻母是氣流不受阻礙而自由通過口腔時形成的音,在發韻母時,聲帶處于振動狀態。在技術視角上,韻母的頻譜通常具有較為明顯的共振峰結構,在頻譜圖上表現為突出的峰值。因此本專利技術設計了基于幅頻峰值頻點的韻母特征提取方法,識別用戶字音的韻母特征。
34、進一步地,所述s2中,分析每個朗讀字音幅頻特征序列的包絡線,構建對應的朗讀字音聲母特征向量的過程,均為:
35、以朗讀字音幅頻特征序列中各元素的序號作為自變量,并以幅度值作為因變量,通過最小二乘法,進行多項式擬合,得到表達式如下的包絡線函數以及各階擬合系數,將各階擬合系數拼接為聲母特征向量,不區分先后順序:
36、,
37、其中,為朗讀字音幅頻特征序列的包絡線函數在自變量為n時的值,n為朗讀字音幅頻特征序列的元素序號,αm為第m階擬合系數,nm為n的m次方運算,α0為第0階擬合系數,r為多項式擬合的最大次方,m為擬合系數階數編號。
38、上述進一步方案的有益效果為:聲母與韻母不同,在發音時,口腔中的氣流被突然釋放,形成瞬間的爆破聲。因此聲母的能量在時域比較集中,而在頻域上則非常寬泛,影響整個頻譜的形狀。本專利技術通過對幅頻的包絡分析,有效地提取聲母特征。
39、進一步地,所述s3中,對比每個朗讀字音與標準普通話字音的韻母特征向量的頻偏和走勢差異的方法,均包括以下步驟:
40、b1、對用戶朗讀字音和標準普通話字音的韻母特征向量進行向量減法,不區分減數與被減數,得到頻偏向量;
41、b2、根據頻偏向量,計算增強系數序列;
42、b3、通過本文檔來自技高網...
【技術保護點】
1.一種語音處理的普通話訓練矯正方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述S1包括以下分步驟:
3.根據權利要求2所述的語音處理的普通話訓練矯正方法,其特征在于,所述S13包括以下分步驟:
4.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述S2中,分析每個朗讀字音幅頻特征序列中的各個幅度峰的頻率,構建對應的朗讀字音韻母特征向量的過程,均包括以下步驟:
5.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述S2中,分析每個朗讀字音幅頻特征序列的包絡線,構建對應的朗讀字音聲母特征向量的過程,均為:
6.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述S3中,對比每個朗讀字音與標準普通話字音的韻母特征向量的頻偏和走勢差異的方法,均包括以下步驟:
7.根據權利要求6所述的語音處理的普通話訓練矯正方法,其特征在于,所述B2所用的表達式為:
8.根據權利要求7所述的語音處理的普通話訓練矯正方法,
9.根據權利要求5所述的語音處理的普通話訓練矯正方法,其特征在于,所述S4中,分級對比每個朗讀字音與標準普通話字音的聲母特征向量的方法,均包括以下步驟:
10.根據權利要求9所述的語音處理的普通話訓練矯正方法,其特征在于,所述C2中,通過下式,根據用戶朗讀字音與標準普通話字音的普通級聲母特征向量,計算用戶朗讀字音聲母非標準值第三分量:
...【技術特征摘要】
1.一種語音處理的普通話訓練矯正方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述s1包括以下分步驟:
3.根據權利要求2所述的語音處理的普通話訓練矯正方法,其特征在于,所述s13包括以下分步驟:
4.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述s2中,分析每個朗讀字音幅頻特征序列中的各個幅度峰的頻率,構建對應的朗讀字音韻母特征向量的過程,均包括以下步驟:
5.根據權利要求1所述的語音處理的普通話訓練矯正方法,其特征在于,所述s2中,分析每個朗讀字音幅頻特征序列的包絡線,構建對應的朗讀字音聲母特征向量的過程,均為:
6.根據權利要求1所述的語音處理的普通...
【專利技術屬性】
技術研發人員:武文燕,陳均黎,寇芙華,王月,袁錚,
申請(專利權)人:成都航空職業技術學院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。