【技術實現步驟摘要】
本專利技術涉及語音信號處理
,具體涉及一種基頻建模方法及系統。
技術介紹
基頻特征作為語音合成技術的重要特征之一,既包括了短時語音段的韻律信息,也包括了長時語音段的韻律信息(超音段的韻律信息),如聲調信息。如何能夠更自然地預測出基頻特征是語音合成效果的重要目標之一。目前普遍采取的基頻建模方法為分層基頻建模方法,即從韻律的產生機理以及log域基頻特征產生的可加性出發進行建模,如式(1)和圖1所示:F0all=F0state+F0phone+F0syllable+F0word (1)對韻律層進行層次劃分,從高到低依次劃分為:單詞層、音節層、音素層、狀態層,如圖1所示,其中每一層的基頻特征都對應著不同的韻律變化?,F有方案從韻律的產生機理出發,對受不同層次上下文屬性影響的韻律變化進行有針對性的建模。然而,現有的分層基頻建模方法并沒有考慮更高層韻律單元的韻律變化,如短語層的韻律變化,導致合成語音的整個句子起伏感不強,聽起來沒有什么情感。此外,現有分層基頻建模方法的建模順序為自高向低逐層建模,并沒有考慮聲調語言的聲調信息對較高韻律層建模效果的影響,導致傳統的隱馬爾可夫模型(Hidden Markov Model,HMM)建模方法不能很好地捕捉較高韻律層的基頻特征,如單詞層信息、短語層信息,使得較高韻律層基頻特征建模效果大大下降。以上原因導致現有基頻建模方法不能更自然地預測出基頻特征。
技術實現思路
本專利技術實施例提供一種基頻建模方法及系統,以解決現有的基頻建模方法不能更自然地預測出基頻特征的問題。為此,本專利技術實施例提供如下技術方案:一種基頻建模方法,包 ...
【技術保護點】
一種基頻建模方法,其特征在于,包括:將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,并確定各層韻律單元,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響。
【技術特征摘要】
1.一種基頻建模方法,其特征在于,包括:將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,并確定各層韻律單元,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響。2.根據權利要求1所述的方法,其特征在于,所述確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響包括:將自然基頻以音節為單位進行劃分,得到各音節單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各音節單元對應的自然基頻特征;根據所述自然基頻特征獲得各音節單元的預測基頻值。3.根據權利要求2所述的方法,其特征在于,所述對所述自然基頻值進行參數化包括:使用優化后的DCT變換對所述自然基頻值進行參數化,所述優化后的DCT變換是指以生成基頻特征與自然基頻特征差的平方和作為目標函數的,對DCT變換系數進行估計;所述根據所述自然基頻特征獲得各音節單元預測基頻值包括:根據各音節單元對應的上下文屬性信息和所述自然基頻特征,對各音節單元對應的自然基頻特征進行基頻建模;根據所述基頻模型,將各音節單元所屬模型均值作為所述音節單元的預測基頻特征;對所述預測基頻特征進行DCT反變換,得到各音節單元的預測基頻值。4.根據權利要求1所述的方法,其特征在于,構建短語層基頻模型包括:將所述音節單元對應的自然基頻值減去所述音節單元的預測基頻值,得到用于去除音節層影響后的短語層建模的自然殘差基頻值;將所述自然殘差基頻值以短語為單位進行劃分,得到各短語單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各短語單元對應的自然基頻特征;利用所述各短語單元對應的自然基頻特征構建短語層基頻模型,得到各短語單元的預測基頻特征。5.根據權利要求1所述的方法,其特征在于,構建單詞層基頻模型包括:將所述短語單元對應的自然基頻值減去所述短語單元的預測基頻值,得到用于單詞層建模的自然殘差基頻值;將所述自然殘差基頻值以單詞為單位進行劃分,得到各單詞單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各單詞單元對應的自然基頻特征;利用所述各單詞單元對應的自然基頻特征構建單詞層基頻模型,得到各單詞單元的預測基頻特征。6.根據權利要求4或5所述的方法,其特征在于,所述方法還包括:使用DCT參數表征短語單元和單詞單元對應的自然基頻特征。7.根據權利要求1至5任一項所述的方法,其特征在于,所述方法還包括:基于DNN的方法對各韻律層的基頻模型參數進行優化。8.一種基頻建模系統,其特征在于,包括:韻律層劃分模塊,用于將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態...
【專利技術屬性】
技術研發人員:殷翔,江源,王影,胡國平,胡郁,劉慶峰,
申請(專利權)人:科大訊飛股份有限公司,
類型:發明
國別省市:安徽;34
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。