本發明專利技術提出一種異質麥克風自動增益校準方法和系統,其方法包括:獲取麥克風信號,對所述信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號;對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號;對所述第二目標信號進行增益控制,獲得第三目標信號。本發明專利技術可以有效抑制信道噪聲而不對目標信號造成過分扭曲,同時對諧波結構進行修復,避免信號失真;同時可以自適應估算混響時間,保證混響抑制的準確性;采用各個頻帶分別計算幅度增益的方法,準確恢復各個頻帶信號,避免同比例擴大但是信號在各個頻帶分辨率并無改善的缺點。
【技術實現步驟摘要】
本專利技術涉及到噪音控制領域,特別是涉及到一種異質麥克風自動增益校準方法及系統。
技術介紹
麥克風語音采集系統通過傳感器感知聲壓信號并轉為數字信號,實現采集環境中聲音信號的目的。不同的麥克風根據具體的應用有著不同的敏感性,比如有些應用麥克風與聲源存在一定距離,需要麥克風有著較高的敏感性,才能保證信號不丟失,帶來的不利影響是會放大系統噪聲;如果降低麥克風的敏感性,固然系統噪聲不至于太大,然而目標信號也同時會存在損失的缺陷。不同的智能終端會根據實際應用的特點,對這二者做一個折中平衡。整體而言,不同的智能終端所內置的麥克風存在的系統噪聲大小、不同的頻率段增益值各有不同,對同一信號采集存在差異性,即“異質性”。近年來隨著互聯網技術、智能硬件的蓬勃發展,語音識別、聲紋識別、聲源檢測等語音智能交互技術開始從實驗室走向用戶。這些聲信號處理技術主要基于一定的數據庫,通過機器學習技術進行建模,實現智能交互的目的。然而,在實際應用中,語音等音頻信號存在數據來源的多樣性特點,即所謂的“異質性”,會造成訓練模型與實際應用的適配,影響智能交互的準確性。異質性主要由三個主要原因造成:(1)聲信號采集設備,即麥克風,存在的信道噪聲,并且不同智能終端信道噪聲在能量大小、頻率分布上各有不同;(2)不同的麥克風采集設備在各個頻帶增益存在不同;(3)由于麥克風與目標聲源距離的變化,造成信號采集上的差異。
技術實現思路
本專利技術的主要目的為提供一種異質麥克風自動增益校準方法,解決聲音信號的異質性。本專利技術提出一種異質麥克風自動增益校準方法,包括以下步驟:對信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號;對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號;對所述第二目標信號進行增益控制,獲得第三目標信號。優選地,所述對信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號的步驟包括:假設信號由目標信號和信道噪音組成,對信號做傅里葉變換;對所有頻率k,初始化噪音功率譜設定為λV(0,k)=0,目標信號功率譜設定為λX(0,k)=0,先驗信噪比ε(0,k)=0,后驗信噪比為γ(0,k)=0;設置平滑因子,更新噪音功率譜密度;根據更新后的噪音功率譜密度和目標信號功率譜計算先驗信噪比,根據更新后的噪音功率譜密度和信號功率譜密度計算后驗信噪比;根據先驗信噪比和后驗信噪比計算噪音抑制控制因子;修正噪音抑制控制因子并對所述信號修正,獲得第一目標信號;根據第一目標信號計算新的目標信號功率譜。優選地,所述噪音抑制控制因子可由以下公式獲得:其中,G(l,k)為噪音抑制控制因子,γ(l,k)為后驗信噪比,ε(l,k)為先驗信噪比,l為時間幀變量,k為頻率變量。優選地,所述對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號的步驟包括:計算所述第一目標信號各個頻率的混響衰減因子;將第一目標信號分解為直達分量和混響分量,更新混響分量功率譜密度和直達分量功率譜密度;根據更新后的混響分量功率譜密度和直達分量功率譜密度計算混響權重因子;計算混響控制因子,獲得第二目標信號。優選地,所述混響分量功率譜密度是由以下公式獲得:λX,Late(l,k)=αexp(-2χ(k)Ne)λX,Late(l-1,k)+(1-α)λ(l,k)其中,λX,Late(l,k)為更新后的混響分量功率譜密度,α為平滑因子,Ne為傅里葉變換窗長,λX,Late(l-1,k)為未更新的混響分量功率譜密度,χ(k)為頻率為k的混響衰減因子,λ(l,k)為時間為l,頻率為k的信號功率譜密度。優選地,所述混響權重因子是由以下公式獲得:其中,為先驗混響權重因子,為后驗混響權重因子,λX,D(l-1,k)為更新前的混響分量功率譜密度,λX,Late(l,k)為更新后的混響分量功率譜密度,為第一目標信號。優選地,所述混響控制因子是由以下公式獲得:其中,GD(l,k)為混響控制因子,ρ為安全門限。優選地,所述對所述第二目標信號進行增益控制,獲得第三目標信號的步驟包括:設定所述第二目標信號指定時間前所有時間幀假設為靜音幀,計算各個頻帶能量的平均值;計算靜音幀各個頻帶能量變化的方差;計算靜音幀各幀總能量,并追蹤最大值;計算目標聲源活動頻帶數量指數;判斷目標聲源信號的存在,若不存在,則將第二目標信號輸出,再經傅立葉逆變化生成第三目標信號;若存在,緩沖設定時長數據,并計算緩沖區內各幀能量值;判斷緩沖區內能量最大值是否大于當前最大值,若否,則將第二目標信號輸出,再經傅立葉逆變化生成第三目標信號;若是,則計算各頻帶增益控制因子,并對第二目標信號進行校準,將校準后的信號經傅立葉逆變化生成第三目標信號。優選地,所述目標聲源活動頻帶數量指數可由以下公式獲得:其中,Λ(l,k)為頻率為k的目標聲源活動頻帶數量指數,Λ(l)為目標聲源活動頻帶數量指數總數,為第二目標信號,為第二目標信號各個頻帶能量的平均值,υD(k)為靜音幀各個頻帶能量變化的方差,k為頻率,K為最大頻率。優選地,所述增益控制因子及校準后的第二目標信號可由以下公式獲得:其中,μ(l,k)為增益控制因子,XF(l,k)為校準后的第二目標信號,Δ(k)為頻帶相關增益控制自適應因子,ηmax為能量最大值,SD(l)為靜音幀各幀總能量,為第二目標信號。優選地,所述頻帶相關增益控制自適應因子Δ(k)可由以下公式獲得:其中,k為頻率,K為最大頻率。本專利技術還提出了一種異質麥克風自動增益校準系統,包括:噪音控制模塊,用于獲取麥克風信號,對所述信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號;混響控制模塊,用于對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號;增益控制模塊,用于對所述第二目標信號進行增益控制,獲得第三目標信號。本專利技術提出一種異質麥克風自動增益校準方法和系統,其方法包括:對信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號;對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號;對所述第二目標信號進行增益控制,獲得第三目標信號。本專利技術可以有效抑制信道噪聲而不對目標信號造成過分扭曲,同時對諧波結構進行修復,避免信號失真;同時可以自適應估算混響時間,保證混響抑制的準確性;采用各個頻帶分別計算幅度增益的方法,準確恢復各個頻帶信號,避免同比例擴大但是信號在各個頻帶分辨率并無改善的缺點。附圖說明圖1為本專利技術一種異質麥克風自動增益校準方法實施例的流程示意圖;圖2為本專利技術一種異質麥克風自動增益校準方法實施例的信道噪聲控制流程圖;圖3為本專利技術一種異質麥克風自動增益校準方法實施例的混響控制流程圖;圖4為本專利技術一種異質麥克風自動增益校準方法實施例的頻帶獨立自適應控制流程圖;圖5為本專利技術一種異質麥克風自動增益校準系統實施例的結構示意圖。本專利技術目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。具體實施方式應當理解,此處所描述的具體實施例僅僅用以解釋本專利技術,并不用于限定本專利技術。如圖1所示,本專利技術提出一種異質麥克風自動增益校準方法,包本文檔來自技高網...
【技術保護點】
一種異質麥克風自動增益校準方法,其特征在于,包括以下步驟:獲取麥克風信號,對所述信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號;對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號;對所述第二目標信號進行增益控制,獲得第三目標信號。
【技術特征摘要】
1.一種異質麥克風自動增益校準方法,其特征在于,包括以下步驟:獲取麥克風信號,對所述信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號;對所述第一目標信號進行混響估算,計算混響控制因子并對所述第一目標信號修正,獲得第二目標信號;對所述第二目標信號進行增益控制,獲得第三目標信號。2.根據權利要求1所述的異質麥克風自動增益校準方法,其特征在于,所述對信號進行信道噪音估算,計算噪音抑制控制因子并對所述信號修正,獲得第一目標信號的步驟包括:假設信號由目標信號和信道噪音組成,對信號做傅里葉變換;對所有頻率k,初始化噪音功率譜設定為λV(0,k)=0,目標信號功率譜設定為λX(0,k)=0,先驗信噪比ε(0,k)=0,后驗信噪比為γ(0,k)=0;設置平滑因子,更新噪音功率譜密度;根據更新后的噪音功率譜密度和目標信號功率譜計算先驗信噪比,根據更新后的噪音功率譜密度和信號功率譜密度計算后驗信噪比;根據先驗信噪比和后驗信噪比計算噪音抑制控制因子;修正噪音抑制控制因子并對所述信號修正,獲得第一目標信號;根據第一目標信號計算新的目標信號功率譜。3.根據權利要求1所述的異質麥克風自動增益校準方法,其特征在于,所述噪音抑制控制因子可由以下公式獲得:G(l,k)=1-(γ(l,k)-ϵ(l,k)-1)24γ(l,k)1-(γ(l,k)-ϵ(l,k)-1)24ϵ(l,k)]]>其中,G(l,k)為噪音抑制控制因子,γ(l,k)為后驗信噪比,ε(l,k)為先驗信噪比,l為時間幀變量,k為頻率變量。4.根據權利要求1所述的異質麥克風自動增益校準方法,其特征在于,所述對...
【專利技術屬性】
技術研發人員:蔡鋼林,
申請(專利權)人:深圳撒哈拉數據科技有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。