一種語(yǔ)音變速的方法包含下列步驟:接收原始語(yǔ)音信號(hào);計(jì)算出該原始語(yǔ)音信號(hào)的基本周期;依據(jù)該基本周期定義搜尋范圍;在該原始語(yǔ)音信號(hào)的每個(gè)該搜尋范圍內(nèi)尋找最大值;依據(jù)該最大值將該原始語(yǔ)音信號(hào)劃分為多個(gè)語(yǔ)音區(qū)段;依據(jù)變速指令對(duì)該原始語(yǔ)音信號(hào)的每個(gè)該語(yǔ)音區(qū)段進(jìn)行變速運(yùn)算,而取得變速語(yǔ)音信號(hào);及輸出該變速語(yǔ)音信號(hào)。上述方法的好處是,將語(yǔ)音信號(hào)以最細(xì)小的基本周期單位進(jìn)行后續(xù)的變速處理。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)是一種,別是一種基于語(yǔ)音信號(hào)的基本周期的語(yǔ) 音變速的方法。
技術(shù)介紹
具備語(yǔ)言學(xué)習(xí)功能的電子設(shè)備,可以將所欲學(xué)習(xí)的語(yǔ)言會(huì)話預(yù)先錄制在 該設(shè)備中,而該電子設(shè)備可為便攜式,讓使用者可以隨時(shí)隨地進(jìn)行語(yǔ)言的學(xué) 習(xí)。然而,每一位使用者的程度并不相同,造成一段播放速度相同的會(huì)話, 有些使用者聽(tīng)起來(lái)會(huì)覺(jué)得閱讀速度適當(dāng)而可以聽(tīng)懂,但卻有些使用者會(huì)覺(jué)得 閱讀速度過(guò)快而聽(tīng)不懂。因此變速播放的功能成為語(yǔ)言學(xué)習(xí)機(jī)所具備的功能 之一。所謂變速播放指的是語(yǔ)言學(xué)習(xí)機(jī)在語(yǔ)音播放時(shí),可以依使用者的需求而 變更播放的速度,而且當(dāng)速度變更時(shí)音調(diào)卻不變。因此理想上,不論變速播 放是變慢或變快,使用者在聆聽(tīng)上都可以聽(tīng)得清楚,而這一項(xiàng)功能對(duì)于語(yǔ)言 學(xué)習(xí)有很大的幫助。傳統(tǒng)語(yǔ)言學(xué)習(xí)機(jī)雖然具有變速播放的功能,但往往經(jīng)過(guò)變速播放后其所 播放出來(lái)的語(yǔ)音便會(huì)失真。由于語(yǔ)音信號(hào)是連續(xù)性的模擬信號(hào),隨著不同人 的發(fā)聲或不同的音源所產(chǎn)生的聲紋頻率并不相同。 一般公知的語(yǔ)音變速的技 術(shù)的做法是將取樣而得的語(yǔ)音數(shù)據(jù)重復(fù)播放,或以間隔的方式跳躍播放,而 達(dá)到播放速度的變更。這樣的做法雖然可以達(dá)到播放速度變慢或變快,且與 原語(yǔ)音的信號(hào)包格線相同,但是會(huì)造成回音與機(jī)械音。同時(shí)造成聲紋頻率降 低,效果就如同將錄音機(jī)馬達(dá)轉(zhuǎn)速變慢或變快一樣,使得語(yǔ)音明顯失真。因此,如何讓使用者在語(yǔ)言學(xué)習(xí)機(jī)上操作變速播放的功能時(shí),語(yǔ)音變速 后能維持原音的音調(diào)而不失真,為一亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
有鑒于此本專利技術(shù)提出一種,針對(duì)語(yǔ)音信號(hào)進(jìn)行處理,讓 使用者按照自己的需求加速或減速語(yǔ)音的播放,而語(yǔ)音經(jīng)過(guò)變速后輸出到使 用者的耳朵, 一樣能清楚而不失原音調(diào)的語(yǔ)音。本專利技術(shù)所提出的一種,包含下列步驟接收一原始語(yǔ)音 信號(hào);計(jì)算出該原始語(yǔ)音信號(hào)的一基本周期;依據(jù)該基本周期定義一搜尋范 圍;在該原始語(yǔ)音信號(hào)的每個(gè)該搜尋范圍內(nèi)尋找一最大值;依據(jù)該最大值將 該原始語(yǔ)音信號(hào)劃分為多個(gè)語(yǔ)音區(qū)段;依據(jù)一變速指令對(duì)該原始語(yǔ)音信號(hào)的 每個(gè)該語(yǔ)音區(qū)段進(jìn)行一變速運(yùn)算,而取得一變速語(yǔ)音信號(hào);及輸出該變速語(yǔ) 音信號(hào)。如本專利技術(shù)所述的,其中該基本周期系利用一總和振幅 差異函數(shù)計(jì)算出。如本專利技術(shù)所述的,其中該基本周期系利用一平均振幅 差異函數(shù)計(jì)算出。如本專利技術(shù)所述的,其中該變速指令為減速時(shí),該變速 運(yùn)算復(fù)制部分該語(yǔ)音區(qū)段,使該變速語(yǔ)音信號(hào)長(zhǎng)于該原始語(yǔ)音信號(hào)。如本專利技術(shù)所述的,其中該變速指令為加速時(shí),該變速 運(yùn)算刪除部分該語(yǔ)音區(qū)段,使該變速語(yǔ)音信號(hào)短于該原始語(yǔ)音信號(hào)。如本專利技術(shù)所述的,其中該變速運(yùn)算包含下列步驟將 該原始語(yǔ)音信號(hào)的每個(gè)該語(yǔ)音區(qū)段乘以一比重函數(shù),成為一比重區(qū)段;及疊 加該比重區(qū)段。如本專利技術(shù)所述的,其中該變速運(yùn)算更包含下列步驟 插入疊加后的該比重區(qū)段在該語(yǔ)音區(qū)段之間。如本專利技術(shù)所述的,其中該變速運(yùn)算更包含下列步驟 以疊加后的該比重區(qū)段取代該語(yǔ)音區(qū)段。如本專利技術(shù)所述的,其中該比重函數(shù)在每一該搜尋范圍 內(nèi),在該最大值之前為遞增函數(shù),在該最大值之后為遞減函數(shù)。如本專利技術(shù)所述的,其中該比重函數(shù)為三角波函數(shù)。如本專利技術(shù)所述的,其中該語(yǔ)音區(qū)段大小不同時(shí),該語(yǔ) 音區(qū)段的重疊部分乘以該比重函數(shù),未重疊部分不需乘以該比重函數(shù)。、本專利技術(shù)一開(kāi)始先將原始語(yǔ)音信號(hào)區(qū)分為多個(gè)語(yǔ)音區(qū)段。所分割的區(qū)段并 不是如傳統(tǒng)技術(shù)一般為固定的,而是根據(jù)總和振幅差異函數(shù)(Sum of Magnitude Difference Function, SMDF)或平均振幅差異函數(shù)(Average of Magnitude Difference Function, AMDF),先取得原始語(yǔ)音信號(hào)的基本周期 (pitch period),再根據(jù)基本周期左右附近的數(shù)據(jù)去尋找最大值。接著利用 尋找出的最大值將原始語(yǔ)音信號(hào)劃分為多個(gè)語(yǔ)音區(qū)段。上述作法的好處是, 將語(yǔ)音信號(hào)以最細(xì)小的基本周期單位進(jìn)行后續(xù)的變速處理。因此,本專利技術(shù)采 用更精確的方法來(lái)改良相關(guān)的語(yǔ)音變速質(zhì)量。附圖說(shuō)明圖1是的流程圖。 圖2是語(yǔ)音信號(hào)的基本周期。圖3是利用總和振幅差異函數(shù)(SMDF)計(jì)算出基本周期的示意圖。圖4是原始語(yǔ)音信號(hào)的語(yǔ)音區(qū)段劃分圖。圖5是變速指令為減速時(shí)的變速運(yùn)算示意圖。圖6是變速指令為加速時(shí)的變速運(yùn)算示意圖。圖7是變速運(yùn)算的細(xì)部流程圖。圖8是變速運(yùn)算疊加后的插入語(yǔ)音區(qū)段示意圖。圖9是變速運(yùn)算疊加后的取代語(yǔ)音區(qū)段示意圖。圖IO是語(yǔ)音區(qū)段大小不同的疊加示意圖。其中附圖標(biāo)記說(shuō)明如下步驟S10:接收原始語(yǔ)音信號(hào)。步驟S20:計(jì)算出原始語(yǔ)音信號(hào)的基本周期。步驟S30:依據(jù)基本周期定義搜尋范圍。步驟S40:在原始語(yǔ)音信號(hào)的每個(gè)搜尋范圍內(nèi)尋找最大值。步驟S50:依據(jù)最大值將原始語(yǔ)音信號(hào)劃分為多個(gè)語(yǔ)音區(qū)段。步驟S60:依據(jù)變速指令對(duì)原始語(yǔ)音信號(hào)的每一語(yǔ)音區(qū)段進(jìn)行變速運(yùn)算,而取得變速語(yǔ)音信號(hào)。步驟S62:將原始語(yǔ)音信號(hào)的每一語(yǔ)音區(qū)段乘以比重函數(shù),成為比重區(qū)段。步驟S64:疊加比重區(qū)段。步驟S70:輸出變速語(yǔ)音信號(hào)。 具體實(shí)旌方式以下參照附圖,解釋有關(guān)本專利技術(shù)的較佳實(shí)施例及其功效。 請(qǐng)參照?qǐng)D1的流程圖,包含下列步驟步驟S10:接收原始語(yǔ)音信號(hào)。原始語(yǔ)音信號(hào)為語(yǔ)言朗讀,例如英語(yǔ)、 日語(yǔ)會(huì)話等。步驟S20:計(jì)算出原始語(yǔ)音信號(hào)的基本周期(pitch period)。人聲的音 高范圍大約在50Hz至1000Hz之間。而朗讀同樣內(nèi)容的一段會(huì)話,每個(gè)人所 念出來(lái)的語(yǔ)音都會(huì)有所不同,這就是每個(gè)人的音色不同。音色的不同代表基 本周期的波形不同,所以每個(gè)不同的語(yǔ)音信號(hào)都有其不同的基本周期。由于 音色是每個(gè)人所特有的,同一個(gè)人所發(fā)出的語(yǔ)音信號(hào)即使語(yǔ)音的內(nèi)容不同, 其基本周期大致上會(huì)差不多。請(qǐng)參照?qǐng)D2語(yǔ)音信號(hào)的基本周期。由圖2所示, 一段語(yǔ)音信號(hào)即使有高 低起伏的變化,但是找到基本周期后,就可以清楚發(fā)現(xiàn)語(yǔ)音信號(hào)即是由多段 的基本周期所組成。所以進(jìn)行語(yǔ)音變速處理的一開(kāi)始,先找出語(yǔ)音信號(hào)的基 礎(chǔ)組成單位基本周期,可以更精確的提升語(yǔ)音變速的質(zhì)量。請(qǐng)參照?qǐng)D3利用總和振幅差異函數(shù)(SMDF)計(jì)算出基本周期的示意圖。 將原始語(yǔ)音信號(hào)位移,和原本的原始語(yǔ)音信號(hào)的重疊部分進(jìn)行點(diǎn)對(duì)點(diǎn)的相 減、取絕對(duì)值及相加,重復(fù)n次后會(huì)得到n個(gè)點(diǎn)積值,這就是所謂的總和振 幅差異函數(shù)(Sum ofMagnitude Difference Function, SMDF)。另外,上述的SMDF計(jì)算方式,由于重疊的波形越來(lái)越短,因此SMDF 的曲線會(huì)越來(lái)越小。為了避免此種情況,我們可以求取歸一化SMDF,也就 是將重疊部分的點(diǎn)積再除以重疊的點(diǎn)數(shù),這就是傳統(tǒng)的平均振幅差異函數(shù) (Average of Magnitude Difference Function, AMDF)。所以,禾擁SMDF 或AMDF都可以計(jì)算出原始語(yǔ)音信號(hào)的基本周期。步驟S30:依據(jù)步驟S20所計(jì)算出的基本周期,定義搜尋范圍。雖然一 段原始的語(yǔ)音信號(hào)是由多段的基本周期所組成。但由于語(yǔ)音內(nèi)容的不同(語(yǔ) 言朗讀內(nèi)容的不同),產(chǎn)生高低音的差別,所以每段基本周期的周期^:小會(huì) 有些微的差異。因此,計(jì)算出基本周期后,在該基本周期左右附近定i一個(gè)搜尋范圍。以方便接下來(lái)要進(jìn)行的搜尋動(dòng)作。步驟S40:在原始語(yǔ)音信號(hào)的每一搜尋范圍內(nèi)尋找最大值。以步驟S30 所定義出的搜尋范圍為單位,搜尋原始語(yǔ)音信號(hào)。在原始語(yǔ)音信號(hào)的每一搜 尋范圍內(nèi)本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種語(yǔ)音變速的方法,包含下列步驟:接收一原始語(yǔ)音信號(hào);計(jì)算出該原始語(yǔ)音信號(hào)的一基本周期;依據(jù)該基本周期定義一搜尋范圍;在該原始語(yǔ)音信號(hào)的每個(gè)該搜尋范圍內(nèi)尋找一最大值;依據(jù)該最大值將該原始語(yǔ)音信號(hào)劃分為 多個(gè)語(yǔ)音區(qū)段;依據(jù)一變速指令對(duì)該原始語(yǔ)音信號(hào)的每個(gè)該語(yǔ)音區(qū)段進(jìn)行一變速運(yùn)算,而取得一變速語(yǔ)音信號(hào);及輸出該變速語(yǔ)音信號(hào)。
【技術(shù)特征摘要】
1.一種語(yǔ)音變速的方法,包含下列步驟接收一原始語(yǔ)音信號(hào);計(jì)算出該原始語(yǔ)音信號(hào)的一基本周期;依據(jù)該基本周期定義一搜尋范圍;在該原始語(yǔ)音信號(hào)的每個(gè)該搜尋范圍內(nèi)尋找一最大值;依據(jù)該最大值將該原始語(yǔ)音信號(hào)劃分為多個(gè)語(yǔ)音區(qū)段;依據(jù)一變速指令對(duì)該原始語(yǔ)音信號(hào)的每個(gè)該語(yǔ)音區(qū)段進(jìn)行一變速運(yùn)算,而取得一變速語(yǔ)音信號(hào);及輸出該變速語(yǔ)音信號(hào)。2. 如權(quán)利要求1的語(yǔ)音變速的方法,其中該基本周期系利用一總和 振幅差異函數(shù)計(jì)算出。3. 如權(quán)利要求1的語(yǔ)音變速的方法,其中該基本周期系利用一平均 振幅差異函數(shù)計(jì)算出。4. 如權(quán)利要求1的語(yǔ)音變速的方法,其中該變速指令為減速時(shí),該 變速運(yùn)算復(fù)制部分該語(yǔ)音區(qū)段,使該變速語(yǔ)音信號(hào)長(zhǎng)于該原始語(yǔ)音信號(hào)。5. 如權(quán)利要求1的語(yǔ)音變速的方法,其中該變速指令為加速時(shí),該 變速運(yùn)算刪除部分該語(yǔ)音區(qū)段,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:顏銘祥,顏睿余,高光前,
申請(qǐng)(專利權(quán))人:微星科技股份有限公司,
類型:發(fā)明
國(guó)別省市:71[中國(guó)|臺(tái)灣]
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。