• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基頻建模方法及系統技術方案

    技術編號:14290437 閱讀:128 留言:0更新日期:2016-12-25 20:38
    本發明專利技術公開了一種基頻建模方法及系統,該方法包括:將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響。利用本發明專利技術,能有效消除聲調信息對較高韻律層建模的影響,進而能更自然地預測出基頻特征。

    【技術實現步驟摘要】

    本專利技術涉及語音信號處理
    ,具體涉及一種基頻建模方法及系統。
    技術介紹
    基頻特征作為語音合成技術的重要特征之一,既包括了短時語音段的韻律信息,也包括了長時語音段的韻律信息(超音段的韻律信息),如聲調信息。如何能夠更自然地預測出基頻特征是語音合成效果的重要目標之一。目前普遍采取的基頻建模方法為分層基頻建模方法,即從韻律的產生機理以及log域基頻特征產生的可加性出發進行建模,如式(1)和圖1所示:F0all=F0state+F0phone+F0syllable+F0word (1)對韻律層進行層次劃分,從高到低依次劃分為:單詞層、音節層、音素層、狀態層,如圖1所示,其中每一層的基頻特征都對應著不同的韻律變化?,F有方案從韻律的產生機理出發,對受不同層次上下文屬性影響的韻律變化進行有針對性的建模。然而,現有的分層基頻建模方法并沒有考慮更高層韻律單元的韻律變化,如短語層的韻律變化,導致合成語音的整個句子起伏感不強,聽起來沒有什么情感。此外,現有分層基頻建模方法的建模順序為自高向低逐層建模,并沒有考慮聲調語言的聲調信息對較高韻律層建模效果的影響,導致傳統的隱馬爾可夫模型(Hidden Markov Model,HMM)建模方法不能很好地捕捉較高韻律層的基頻特征,如單詞層信息、短語層信息,使得較高韻律層基頻特征建模效果大大下降。以上原因導致現有基頻建模方法不能更自然地預測出基頻特征。
    技術實現思路
    本專利技術實施例提供一種基頻建模方法及系統,以解決現有的基頻建模方法不能更自然地預測出基頻特征的問題。為此,本專利技術實施例提供如下技術方案:一種基頻建模方法,包括:將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,并確定各層韻律單元,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響。優選地,所述確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響包括:將自然基頻以音節為單位進行劃分,得到各音節單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各音節單元對應的自然基頻特征;根據所述自然基頻特征獲得各音節單元的預測基頻值。優選地,所述對所述自然基頻值進行參數化包括:使用優化后的DCT變換對所述自然基頻值進行參數化,所述優化后的DCT變換是指以生成基頻特征與自然基頻特征差的平方和作為目標函數的,對DCT變換系數進行估計;所述根據所述自然基頻特征獲得各音節單元預測基頻值包括:根據各音節單元對應的上下文屬性信息和所述自然基頻特征,對各音節單元對應的自然基頻特征進行基頻建模;根據所述基頻模型,將各音節單元所屬模型均值作為所述音節單元的預測基頻特征;對所述預測基頻特征進行DCT反變換,得到各音節單元的預測基頻值。優選地,構建短語層基頻模型包括:將所述音節單元對應的自然基頻值減去所述音節單元的預測基頻值,得到用于去除音節層影響后的短語層建模的自然殘差基頻值;將所述自然殘差基頻值以短語為單位進行劃分,得到各短語單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各短語單元對應的自然基頻特征;利用所述各短語單元對應的自然基頻特征構建短語層基頻模型,得到各短語單元的預測基頻特征。優選地,構建單詞層基頻模型包括:將所述短語單元對應的自然基頻值減去所述短語單元的預測基頻值,得到用于單詞層建模的自然殘差基頻值;將所述自然殘差基頻值以單詞為單位進行劃分,得到各單詞單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各單詞單元對應的自然基頻特征;利用所述各單詞單元對應的自然基頻特征構建單詞層基頻模型,得到各單詞單元的預測基頻特征。優選地,所述方法還包括:使用DCT參數表征短語單元和單詞單元對應的自然基頻特征。優選地,所述方法還包括:基于DNN的方法對各韻律層的基頻模型參數進行優化。一種基頻建模系統,包括:韻律層劃分模塊,用于將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,并確定各層韻律單元,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;影響確定模塊,用于確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;建模模塊,用于根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響,所述建模模塊包括:短語層建模模塊,單詞層建模模塊,低層建模模塊。優選地,所述影響確定模塊包括:自然基頻劃分單元,用于將自然基頻以音節為單位進行劃分,得到各音節單元對應的自然基頻值;參數化單元,用于對所述自然基頻值進行參數化,得到各音節單元對應的
    自然基頻特征;預測基頻值獲取單元,用于根據所述自然基頻特征獲得各音節單元的預測基頻值。優選地,所述參數化單元,具體用于使用優化后的DCT變換對所述自然基頻值進行參數化,所述優化后的DCT變換是指以生成基頻特征與自然基頻特征差的平方和作為目標函數的,對DCT變換系數進行估計;所述預測基頻值獲取單元包括:基頻建模子單元,用于根據各音節單元對應的上下文屬性信息和所述自然基頻特征,對各音節單元對應的自然基頻特征進行基頻建模;預測子單元,用于根據所述基頻模型,將各音節單元所屬模型均值作為所述音節單元的預測基頻特征;DCT反變換子單元,用于對所述預測基頻特征進行DCT反變換,得到各音節單元的預測基頻值。優選地,所述短語層建模模塊包括:短語層獲取單元,用于將所述音節單元對應的自然基頻值減去所述音節單元的預測基頻值,得到用于去除音節層影響后的短語層建模的自然殘差基頻值;短語層劃分單元,用于將所述自然殘差基頻值以短語為單位進行劃分,得到各短語單元對應的自然基頻值;短語層參數化單元,用于對所述自然基頻值進行參數化,得到各短語單元對應的自然基頻特征;短語層預測單元,用于利用所述各短語單元對應的自然基頻特征構建短語層基頻模型,得到各短語單元的預測基頻特征。優選地,所述單詞層建模模塊包括:單詞層獲取單元,用于將所述短語單元對應的自然基頻值減去所述短語單元的預測基頻值,得到用于單詞層建模的自然殘差基頻值;單詞層劃分單元,用于將所述自然殘差基頻值以單詞為單位進行劃分,得到各單詞單元對應的自然基頻值;單詞層參數化單元,用于對所述自然基頻值進行參數化,得到各單詞單元
    對應的自然基頻特征;單詞層預測單元,用于利用所述各單詞單元對應的自然基頻特征構建單詞層基頻模型,得到各單詞單元的預測基頻特征。優選地,所述系統還包括:模型參數優化模塊,用于基于DNN的方法對各韻律層的基頻模型參數進行優化。本專利技術實施例提供的基頻建模方法及系統,通過將韻律層從高到低劃分為包括短語層的各韻律層,增加對短語層基頻特征的建模,從而可以增強合成語句的起伏感,并在對較高韻律層(短語層、單詞層)的基頻特征進行建模之前,去除了聲調信息對較高韻律層基頻建模的影響,提高了較高韻律層基頻特征建模的效果。進一步地,對較高韻律層的基頻特征采用優化后的DCT變換本文檔來自技高網
    ...
    一種基頻建模方法及系統

    【技術保護點】
    一種基頻建模方法,其特征在于,包括:將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,并確定各層韻律單元,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響。

    【技術特征摘要】
    1.一種基頻建模方法,其特征在于,包括:將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態層,并確定各層韻律單元,所述短語層和所述單詞層為較高韻律層,所述音節層、所述音素層和所述狀態層為較低韻律層;確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響;根據所述韻律單元的基頻特征采用迭代方式從高到低逐層構建基頻模型,并且對于較高韻律層,在構建基頻模型時去除所述音節層包含的聲調信息對較高韻律層基頻建模的影響。2.根據權利要求1所述的方法,其特征在于,所述確定所述音節層包含的聲調信息對較高韻律層基頻建模的影響包括:將自然基頻以音節為單位進行劃分,得到各音節單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各音節單元對應的自然基頻特征;根據所述自然基頻特征獲得各音節單元的預測基頻值。3.根據權利要求2所述的方法,其特征在于,所述對所述自然基頻值進行參數化包括:使用優化后的DCT變換對所述自然基頻值進行參數化,所述優化后的DCT變換是指以生成基頻特征與自然基頻特征差的平方和作為目標函數的,對DCT變換系數進行估計;所述根據所述自然基頻特征獲得各音節單元預測基頻值包括:根據各音節單元對應的上下文屬性信息和所述自然基頻特征,對各音節單元對應的自然基頻特征進行基頻建模;根據所述基頻模型,將各音節單元所屬模型均值作為所述音節單元的預測基頻特征;對所述預測基頻特征進行DCT反變換,得到各音節單元的預測基頻值。4.根據權利要求1所述的方法,其特征在于,構建短語層基頻模型包括:將所述音節單元對應的自然基頻值減去所述音節單元的預測基頻值,得到用于去除音節層影響后的短語層建模的自然殘差基頻值;將所述自然殘差基頻值以短語為單位進行劃分,得到各短語單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各短語單元對應的自然基頻特征;利用所述各短語單元對應的自然基頻特征構建短語層基頻模型,得到各短語單元的預測基頻特征。5.根據權利要求1所述的方法,其特征在于,構建單詞層基頻模型包括:將所述短語單元對應的自然基頻值減去所述短語單元的預測基頻值,得到用于單詞層建模的自然殘差基頻值;將所述自然殘差基頻值以單詞為單位進行劃分,得到各單詞單元對應的自然基頻值;對所述自然基頻值進行參數化,得到各單詞單元對應的自然基頻特征;利用所述各單詞單元對應的自然基頻特征構建單詞層基頻模型,得到各單詞單元的預測基頻特征。6.根據權利要求4或5所述的方法,其特征在于,所述方法還包括:使用DCT參數表征短語單元和單詞單元對應的自然基頻特征。7.根據權利要求1至5任一項所述的方法,其特征在于,所述方法還包括:基于DNN的方法對各韻律層的基頻模型參數進行優化。8.一種基頻建模系統,其特征在于,包括:韻律層劃分模塊,用于將韻律層從高到低依次劃分為:短語層、單詞層、音節層、音素層、狀態...

    【專利技術屬性】
    技術研發人員:殷翔江源,王影,胡國平胡郁劉慶峰
    申請(專利權)人:科大訊飛股份有限公司,
    類型:發明
    國別省市:安徽;34

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品无码国产自产拍在线观看蜜| 亚洲精品无码久久| 无码av中文一二三区| 无码欧精品亚洲日韩一区夜夜嗨 | 亚洲精品无码mv在线观看网站| 中文字幕无码无码专区| 亚洲国产AV无码一区二区三区| 国内精品人妻无码久久久影院导航 | 麻豆亚洲AV成人无码久久精品| 在线观看免费无码专区| 91精品久久久久久无码| 国产热の有码热の无码视频| 久久亚洲精品无码网站| 久久久无码人妻精品无码| 成人av片无码免费天天看| 少妇久久久久久人妻无码| 99热门精品一区二区三区无码| 亚洲Av无码国产情品久久 | 无码精品前田一区二区| 久久精品无码一区二区WWW| 亚洲精品无码MV在线观看| julia无码人妻中文字幕在线 | 九九无码人妻一区二区三区| 久久亚洲AV成人无码国产| 中文字幕无码AV波多野吉衣| 亚洲国产精品成人AV无码久久综合影院 | 亚洲精品无码久久不卡| 免费无码AV片在线观看软件| 久久精品亚洲AV久久久无码| 日韩爆乳一区二区无码| 久久久久亚洲av无码尤物| 亚洲av永久无码精品古装片| 中国无码人妻丰满熟妇啪啪软件| 精品无码三级在线观看视频| 人妻av中文字幕无码专区| 无码人妻H动漫中文字幕| 好了av第四综合无码久久| 精品人妻无码专区在中文字幕 | 中国无码人妻丰满熟妇啪啪软件 | 中文字幕精品三区无码亚洲| 无码AV天堂一区二区三区|