本發明專利技術屬于聲學處理領域,提供了一種調節語音音量的方法和裝置,以自適應地調節語音音量,使得在任何環境下用戶都能聽清語音內容。所述方法包括:獲取單位時間幀上數字聲音數據的能量值;根據所述單位時間幀上數字聲音數據的能量值,判斷當前的聲音是否為語音;若所述當前聲音為語音且音量低于預設音量閾值,則調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值。由于本發明專利技術的技術方案是直接去調節語音的音量而并非去抑制噪音音量,因此,本發明專利技術提供的技術方案調節語音的效果更好,使得用戶在嘈雜的環境下亦能聽清語音內容。
【技術實現步驟摘要】
一種調節語音音量的方法和裝置
本專利技術屬于聲學處理領域,尤其涉及一種調節語音音量的方法和裝置。
技術介紹
手機作為一種大眾化電子產品,已經成為生活的必需品,其移動性為人們提供了很大的方便。由于手機的移動性,使得用戶可以在各種環境中使用手機,例如比較安靜的環境或比較嘈雜的環境。然而,當用戶在不同的環境中使用手機進行通話時,環境噪聲對用戶的干擾不同。在比較嘈雜的環境中進行通話時,手機的通話音量可能讓用戶很難聽清楚,而在比較安靜的環境中進行通話時,手機的通話音量可能又顯得過大。現有的一種調節語音音量的方法是計算總聲音數據的能量和語音數據的能量,將總聲音數據的能量減去語音數據的能量,獲得環境噪音數據的能量,再根據環境噪音數據的能量去調節語音數據的能量。上述現有的調節語音音量的方法實際上是通過抑制環境噪音數據的能量來實現調節語音數據的能量的目的,這種方式的效果有時會欠佳,例如,即使抑制了環境噪音數據的能量,但語音數據的能量仍然很小的話,則用戶仍然聽不清楚語音的內容。
技術實現思路
本專利技術的目的在于提供一種調節語音音量的方法和裝置,以自適應地調節語音音量,使得在任何環境下用戶都能聽清語音內容。本專利技術第一方面提供一種調節語音音量的方法,所述方法包括:獲取單位時間幀上數字聲音數據的能量值;根據所述單位時間幀上數字聲音數據的能量值,判斷當前的聲音是否為語音;若所述當前聲音為語音且音量低于預設音量閾值,則調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值。本專利技術第二方面提供一種調節語音音量的裝置,所述裝置包括:獲取模塊,用于獲取單位時間幀上數字聲音數據的能量值;判斷模塊,用于根據所述單位時間幀上數字聲音數據的能量值,判斷當前的聲音是否為語音;調節模塊,用于若所述當前聲音為語音且音量低于預設音量閾值,則調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值。從上述本專利技術技術方案可知,本專利技術的技術方案是在判斷當前聲音是為語音后,對語音的音量進行調節,與現有技術通過抑制環境噪音數據的能量來實現調節語音數據的能量的目的相比,由于本專利技術的技術方案是直接去調節語音的音量而并非去抑制噪音音量,因此,本專利技術提供的技術方案調節語音的效果更好,使得用戶在嘈雜的環境下亦能聽清語音內容。附圖說明圖1是本專利技術實施例一提供的調節語音音量的方法的實現流程示意圖;圖2是本專利技術實施例二提供的調節語音音量的裝置的結構示意圖;圖3是本專利技術實施例三提供的調節語音音量的裝置的結構示意圖;圖4是本專利技術實施例四提供的調節語音音量的裝置的結構示意圖;圖5是本專利技術實施例五提供的調節語音音量的裝置的結構示意圖;圖6-a是本專利技術實施例六提供的調節語音音量的裝置的結構示意圖;圖6-b是本專利技術實施例七提供的調節語音音量的裝置的結構示意圖;圖6-c是本專利技術實施例八提供的調節語音音量的裝置的結構示意圖;圖6-d是本專利技術實施例八提供的調節語音音量的裝置的結構示意圖。具體實施方式為了使本專利技術的目的、技術方案及有益效果更加清楚明白,以下結合附圖及實施例,對本專利技術進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本專利技術,并不用于限定本專利技術。本專利技術實施例提供一種調節語音音量的方法,所述方法包括:獲取單位時間幀上數字聲音數據的能量值;根據所述單位時間幀上數字聲音數據的能量值,判斷當前聲音是否為語音;若所述當前聲音為語音且音量低于預設音量閾值,則調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值。本專利技術實施例還提供相應的調節語音音量的裝置。以下分別進行詳細說明。請參閱附圖1,是本專利技術實施例一提供的調節語音音量的方法的實現流程示意圖,主要包括以下步驟S101至步驟S103,詳細說明如下:S101,獲取單位時間幀上數字聲音數據的能量值。在本專利技術實施例中,在獲取單位時間幀上數字聲音數據的能量值之前,所述方法還包括將來自麥克的模擬聲音數據轉換為數字聲音數據并調節數字聲音數據的增益,例如,模數轉換模塊即模數轉換器(ADC)將來自麥克的模擬聲音數據轉換為數字聲音數據,并且,模數轉換模塊中的接口接收軟件提供的增益(Gain),從而調節數字聲音數據的增益。作為本專利技術一個實施例,獲取單位時間幀上數字聲音數據的能量值可通過如下步驟S1011至S1013實現:S1011,對數字聲音數據進行快速離散傅立葉變換,獲得單位時間內的頻譜數據。具體可以是將連續的數字聲音數據按照單位時間數據幀置入控制器的硬件傅立葉計算單元中進行快速離散傅立葉變換,獲得單位時間內的頻譜數據。需要說明的是,由于在本專利技術實施例中,傅立葉計算單元通過硬件實現,因此,對數字聲音數據進行快速離散傅立葉變換,獲得單位時間內的頻譜數據的計算速度相當快,且穩定性好。S1012,計算頻譜數據的平方以獲得各個頻點的能量譜。S1013,將各個頻點的能量譜求和后轉換為功率得到單位時間幀上數字聲音數據的能量值。S102,根據經步驟S101獲取的單位時間幀上數字聲音數據的能量值,判斷當前聲音是否為語音。由于人的聲音具有連續性,即,當聲音連續時間超過設定的閾值,例如,超過100ms,則可認為該聲音為人的聲音即語音,當連續一定時間,例如,超過300ms無聲則認為沒人說話。因此,根據經步驟S101獲取的單位時間幀上數字聲音數據的能量值,判斷當前聲音是否為語音具體可以是:計算連續預設時間內當前數字聲音數據的能量最大值與能量最小值之差,若連續預設時間內當前數字聲音數據的能量最大值與能量最小值之差大于預設能量閾值,則確定當前聲音為語音。S103,若當前聲音為語音且音量低于預設音量閾值,則調節語音的音量直至語音的音量不低于預設音量閾值。在本專利技術一個實施例中,調節語音的音量直至語音的音量不低于預設音量閾值可以是:將所述語音的音量與預設音量閾值比較,若所述語音的音量小于所述預設音量閾值,則向模數轉換模塊反饋增益,以使模數轉換模塊根據增益增大語音的音量直至語音的音量不低于所述預設音量閾值。如前所述,本專利技術實施例的模數轉換模塊實際是一個模數轉換器(ADC)除了用于將來自麥克的模擬聲音數據轉換為數字聲音數據之外,其中的接口還接收軟件提供的增益(Gain);從接口讀取軟件提供的當前增益后,若語音音量偏小,則將增益增大,再將增大的增益值寫入接口,ADC將該增益設置為對應芯片內部運算放大器的增益值,從而調節數字聲音數據的增益。從上述附圖1示例的調節語音音量的方法可知,是在判斷當前聲音是為語音后,對語音的音量進行調節,與現有技術通過抑制環境噪音數據的能量來實現調節語音數據的能量的目的相比,由于本專利技術實施例提供的方法是直接去調節語音的音量而并非去抑制噪音音量,因此,本專利技術實施例提供的方法調節語音的效果更好,使得用戶在嘈雜的環境下亦能聽清語音內容。請參閱附圖2,是本專利技術實施例二提供的調節語音音量的裝置的結構示意圖。為了便于說明,附圖2僅示出了與本專利技術實施例相關的部分。附圖2示例的調節語音音量的裝置可以是附圖1示例的調節語音音量的方法的執行主體。附圖2示例的調節語音音量的裝置主要包括獲取模塊201、判斷模塊202和調節模塊203,其中:獲取模塊201,用于獲取單位時間幀上數字聲音數據的能量值;判斷模塊202,用于根據單位時間幀上數字聲音數據的能量值,判斷當前的聲音是否為本文檔來自技高網...

【技術保護點】
一種調節語音音量的方法,其特征在于,所述方法包括:獲取單位時間幀上數字聲音數據的能量值;根據所述單位時間幀上數字聲音數據的能量值,判斷當前聲音是否為語音;若所述當前聲音為語音且音量低于預設音量閾值,則調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值。
【技術特征摘要】
1.一種調節語音音量的方法,其特征在于,所述方法包括:獲取單位時間幀上數字聲音數據的能量值;根據所述單位時間幀上數字聲音數據的能量值,判斷當前聲音是否為語音;若所述當前聲音為語音且音量低于預設音量閾值,則調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值。2.如權利要求1所述的方法,其特征在于,所述獲取單位時間幀上數字聲音數據的能量值,包括:對所述數字聲音數據進行快速離散傅立葉變換,獲得所述單位時間內的頻譜數據;計算所述頻譜數據的平方以獲得各個頻點的能量譜;將所述各個頻點的能量譜求和后轉換為功率得到單位時間幀上數字聲音數據的能量值。3.如權利要求1所述的方法,其特征在于,所述根據所述單位時間幀上數字聲音數據的能量值,判斷當前聲音是否為語音包括:計算連續預設時間內當前數字聲音數據的能量最大值與能量最小值之差;若所述連續預設時間內當前數字聲音數據的能量最大值與能量最小值之差大于預設能量閾值,則確定所述當前聲音為語音。4.如權利要求1所述的方法,其特征在于,所述調節所述語音的音量直至所述語音的音量不低于所述預設音量閾值包括:將所述語音的音量與所述預設音量閾值比較;若所述語音的音量小于所述預設音量閾值,則向模數轉換模塊反饋增益,以使所述模數轉換模塊根據所述增益增大所述語音的音量直至所述語音的音量不低于所述預設音量閾值。5.如權利要求1至4任意一項所述的方法,其特征在于,所述獲取單位時間幀上數字聲音數據的能量值之前,所述方法還包括:將來自麥克的模擬聲音數據轉換為所述數字聲音數據并調節所述數字聲音數據的增益。...
【專利技術屬性】
技術研發人員:申奎奎,
申請(專利權)人:建榮半導體深圳有限公司,建榮集成電路科技珠海有限公司,珠海煌榮集成電路科技有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。