計算機對語音數據進行濾波,并根據濾波結果過零的時刻確定基音長度。只要從語音數據的對數倒頻譜提取的基音長度與周期圖的偏差不超過預定量,就將濾波的通帶的中央頻率控制為與根據過零時間確定的基音長度的倒數相等的值。接下來,計算機根據濾波結果,將語音數據分割為片斷的單元基音,并將各片斷的相位和采樣數設為常數,以消除基音波動的影響。然后,通過多種方法對獲得的基音波形數據進行內插,且將其中諧波成分較少的數據與表示每一片斷的原始采樣數目及幅度的數據一起輸出。(*該技術在2022年保護過期,可自由使用*)
【技術實現步驟摘要】
本專利技術涉及一種基音波形信號發生設備、基音波形信號發生方法及程序。下面將根據生成人類語音的過程來說明基音及共振峰。人類語音的生成過程通過振動聲帶部分,首先生成包含脈沖序列的聲音。該脈沖以特定于單詞的每一音素的給定周期生成,該周期稱為“基音”。脈沖的頻譜分布于較寬的頻帶中,同時在基音的整倍數間隔處排列有相對強的頻譜成分。接下來,隨著脈沖通過聲帶,脈沖在由聲帶和舌頭的形狀所形成的空間中被濾波。濾波生成了僅強調脈沖中某一頻率成分的聲音。(即,產生了共振峰。)上面是語音生成過程。在聲帶生成的脈沖中需強調的頻率成分隨著聲帶和舌頭移動而改變。如果該變化與單詞相聯系,則形成了語音。因此在需要語音合成的情況下,如果聲帶的濾波特性得到模擬,則在理論上可以得到具有帶有自然感覺的語音質量的合成語音。由于實際上人類的聲帶實際上非常復雜,所以對于普通計算機可達到的能力而言,模擬人類聲帶及其困難。因此要在將聲帶簡化至一定程度的模型的假設下進行人類聲帶的模擬。進一步,盡管基音在某種程度上可以被看作周期恒定,然而基音易于受到人類感覺或意識的影響,并在現實中輕微波動。用計算機模擬基音的這種變化幾乎是不可能的?,F有的使用語音的基音及共振峰的方案在實現具有自然真實語音質量的語音合成時非常困難。有一種語音合成方案稱為“主體系統”。該方案通過對實際的人類語音的每一音素及基音進行分類,并通過將這些波形以與文本等匹配的方式聯結而實現語音合成,從而建立數據庫。由于該方案使用了實際的人類語音的波形,所以獲得了通過模擬無法得到的自然真實的語音質量。但是,生成的人類語音有相當多樣的模式,再加上情緒表達則幾近無限。因此,需要存入數據庫的波形的數量將變得很龐大。所以需要一種壓縮數據庫中的數據量的方案。作為壓縮數據庫中數據量的方案,已經提出了一種方案,在沒有代表文本等中需表示的原始音素的波形的情況下,選擇一個能夠與該音素最近似的音素。因為即使這種方案的實現依然使得數據庫的數據量非常大,且該方案通過非自然地聯結不應在第一場合使用的音素而合成語音,所以產生了合成的語音因聯結質量差而不自然的問題。為此,將一種對要存入數據庫的各波形進行壓縮的方案用作壓縮數據庫中的數據量的方案??梢韵氲降膲嚎s波形的方案是將波形轉換為頻譜,并除去由于掩蔽效應而令人類難以聽到的成分。這種方案用于壓縮技術中,如MP3(MPEG 1音頻層3)、ATRAC(適應轉換聲學編碼)和AAC(高級音頻編碼)。但是,前面所述的基音的波動引起一個問題。人類生成的語音的頻譜具有相對較強的、以與基音的倒數相等的間隔排列的頻譜。如果語音沒有基音波動,則上述的使用掩蔽效應的壓縮可以有效地完成。但是因為基音隨說話者的感情和意識(情緒)而波動,所以在相同的說話者說出具有多個基音的相同詞(音素)的情況下,基音間隔并不通常保持恒定。如果以多個基音對人類實際發出的語音進行采樣以分析該頻譜,則上述相對較強的頻譜不會出現在分析結果中,且使用基于該頻譜的掩蔽效應的壓縮不能保證有效的壓縮。為了達到這個目標,根據本專利技術的第一個方面的基音波形信號發生設備的特征為包含濾波器(102,6),通過對輸入語音信號進行濾波而提取基音信號;相位調整裝置(102,7,8,9),根據由所述濾波器提取的基音信號將所述語音信號分割為片斷,并根據與每一片斷中的基音信號的相關度而調整相位;采樣裝置(102,11),根據由所述相位調整裝置進行相位調整的每一片斷中的相位來確定采樣長度,并通過與采樣長度一致地實現采樣而生成采樣信號;和基音波形信號發生裝置(102,15),基于所述相位調整裝置的調整結果以及所述采樣長度的值,從所述采樣信號中生成基音波形信號?;舨ㄐ涡盘柊l生設備可以進一步包括濾波系數確定裝置(102,5),其根據基音信號和語音信號的參考頻率確定濾波器的濾波系數,在這種情況下,濾波器可以根據濾波系數確定裝置的決定來改變它的濾波系數。相位調整裝置可以通過對于所述基音信號的每一單位周期進行語音信號分割而確定每一所述片斷,且相位調整裝置可以對于每一所述片斷進行相移,使相位成為根據通過將所述語音信號相移至不同相位而得到的信號與所述基音信號之間的相關度而得到的相位。相位調整裝置可以有相位確定裝置(102,8),其對于所述基音信號的每一單位周期進行語音信號分割而確定每一所述片斷,且對于每一所述片斷,在根據將所述語音信號相移至不同相位而得到的信號與所述基音信號之間的相關度而進行相移后確定相位;和裝置(102,9),其將每一所述片斷偏移至所述相位確定裝置確定的相位,并將每一所述片斷的幅度乘以一個常數以改變幅度。該常數是例如這樣的值使各片斷的幅度的有效值成為共同常數值基音波形信號發生裝置可以進一步根據該常數及采樣信號的采樣數目,生成基音波形信號。相位調整裝置可以以這樣的方式將語音信號分割為片斷使得用于所述濾波器提取的基音信號的時刻實質上變為0的點成為所述片斷的起點。根據本專利技術的第二個方面的基音波形信號發生設備的特征為語音的基音被確定(102,7);根據確定的基音的值,語音信號被分割為包含語音信號的單位基音的片斷(102,8);以及通過在每一片斷中調整語音信號的相位而將所述語音信號處理為基音波形信號(102,9)。根據本專利技術的第三個方面的基音波形信號發生方法設備的特征為通過對輸入的語音信號進行濾波而提取基音信號(102,6);根據提取的基音信號而將所述語音信號分割為片斷,并根據與每一片斷中的基音信號的相關度而調整相位(102,7,8,9);根據經過相位調整的每一片斷中的相位來確定采樣長度,并通過以采樣長度一致地完成采樣而生成采樣信號(102,11);和基于調整結果和所述采樣長度的值,從所述采樣信號中生成基音波形信號(102,15)。根據本專利技術的第四個方面的計算機可讀記錄介質的特性為記錄了用于使計算機可以完成如下功能的程序濾波器(102,6),通過對輸入語音信號進行濾波而提取基音信號;相位調整裝置(102,7,8,9),根據由所述濾波器提取的基音信號將所述語音信號分割為片斷,并根據與每一片斷中的基音信號的相關度而調整相位;采樣裝置(102,11),根據由所述相位調整裝置進行相位調整的每一片斷中的相位來確定采樣長度,并通過與采樣長度一致地實現采樣而生成采樣信號;和基音波形信號發生裝置(102,15),基于所述相位調整裝置的調整結果以及所述采樣長度的值,從所述采樣信號中生成基音波形信號。根據本專利技術的第五個方面的嵌于載波中的計算機數據信號的特征為提供使計算機可以完成如下功能的程序濾波器(102,6),通過對輸入語音信號進行濾波而提取基音信號;相位調整裝置(102,7,8,9),根據由所述濾波器提取的基音信號將所述語音信號分割為片斷,并根據與每一片斷中的基音信號的相關度而調整相位;采樣裝置(102,11),根據由所述相位調整裝置進行相位調整的每一片斷中的相位來確定采樣長度,并通過與采樣長度一致地實現采樣而生成采樣信號;和基音波形信號發生裝置(102,15),基于所述相位調整裝置的調整結果以及所述采樣長度的值,從所述采樣信號中生成基音波形信號。根據本專利技術的第六個方面的程序的特征是使計算機可以完成如下功能濾波器(102,6),通過對輸入語音信號進行濾波而提取基音信號本文檔來自技高網...
【技術保護點】
一種基音波形信號發生設備,其特征在于包括: 濾波器(102,6),通過對輸入語音信號進行濾波而提取基音信號; 相位調整裝置(102,7,8,9),根據由所述濾波器提取的基音信號將所述語音信號分割為片斷,并根據與每一片斷中的基音信號的相關度而調整相位; 采樣裝置(102,11),根據由所述相位調整裝置進行相位調整的每一片斷中的相位來確定采樣長度,并通過與采樣長度一致地實現采樣而生成采樣信號;和 基音波形信號發生裝置(102,15),基于所述相位調整裝置的調整結果以及所述采樣長度的值,從所述采樣信號中生成基音波形信號。
【技術特征摘要】
JP 2001-8-31 263395/011.一種基音波形信號發生設備,其特征在于包括濾波器(102,6),通過對輸入語音信號進行濾波而提取基音信號;相位調整裝置(102,7,8,9),根據由所述濾波器提取的基音信號將所述語音信號分割為片斷,并根據與每一片斷中的基音信號的相關度而調整相位;采樣裝置(102,11),根據由所述相位調整裝置進行相位調整的每一片斷中的相位來確定采樣長度,并通過與采樣長度一致地實現采樣而生成采樣信號;和基音波形信號發生裝置(102,15),基于所述相位調整裝置的調整結果以及所述采樣長度的值,從所述采樣信號中生成基音波形信號。2.根據權利要求1所述的基音波形信號發生設備,進一步包括濾波系數確定裝置(102,5),其根據所述基音信號和所述語音信號的參考頻率確定所述濾波器的濾波系數,且其中所述濾波器根據所述濾波系數確定裝置的決定來改變它的濾波系數。3.根據權利要求1所述的基音波形信號發生設備,其中所述相位調整裝置通過對于所述基音信號的每一單位周期進行語音信號分割而確定每一所述片斷,且相位調整裝置可以對于每一所述片斷進行相移,使相位成為根據通過將所述語音信號相移至不同相位而得到的信號與所述基音信號之間的相關度而得到的相位。4.根據權利要求1所述的基音波形信號發生設備,其中所述相位調整裝置包括相位確定裝置(102,8),其對于所述基音信號的每一單位周期進行語音信號分割而確定每一所述片斷,且對于每一所述片斷,在根據將所述語音信號相移至不同相位而得到的信號與所述基音信號之間的相關度而進行相移后確定相位;和裝置(102,9),其將每一所述片斷偏移至所述相位確定裝置確定的相位,并將每一所述片斷的幅度乘以一個常數以改變幅度。5.根據權利要求4所述的基音波形信號發生設備,其中所述常數是這樣的值使各片斷的幅度的有效值成為共同常數值。6.根據權利要求5所述的基音波形信號發生設備,其中所述基音波形信號發生裝置進一步根據所述常數及所述采樣信號的采樣數目,生成所述基音波形信號。7.根據權利要求1所述的基音波形信號發生設備,其中所述相位調整裝置以這樣的方式將所述語音信號分割為所述片斷使得用于所述濾波器提取的基音信號的時刻實質上變為0的點成為所述片斷的起點。8.一種基音波形信號發生設備,其特征為語音的基音被確定(102,7);根據確定的基音的值,語音信號被分割為包含語音信號的單位基音的片斷(102,8);以及通過...
【專利技術屬性】
技術研發人員:佐藤寧,
申請(專利權)人:株式會社建伍,
類型:發明
國別省市:JP[日本]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。