The invention relates to a target speech detection method based on two order cone programming, which comprises the following steps: the lowest sidelobe design for target beam direction is formed, the weight calculation of the lowest sidelobe beam using two order cone programming form; structure noise estimation weight; estimation of signal and noise signal of the target; using the method of order recursive smoothing to calculate power signal and noise signal of the target; using power and noise signals of the target signal to calculate the posterior SNR; the posteriori SNR of minimum tracking, to obtain the posterior minimum signal-to-noise ratio; calculation of band in the range of 3437.5Hz to 281.25Hz after the test of the signal-to-noise ratio of the minimum value of the odds ratio and signal-to-noise ratio; judge with the threshold set size to determine the direction of speech presence. The detection method of the invention has the advantages of less steps and less calculation, and the frequency domain summation can avoid the instability of certain frequency points.
【技術實現步驟摘要】
基于二階錐規劃的目標方向語音檢測方法
本專利技術涉及目標方向語音檢測
,特指一種基于二階錐規劃的目標方向語音檢測方法。
技術介紹
目標方向語音檢測是一種能夠判斷出目標方向語音在當前時間是否存在的技術,它在人機交互、語音增強、遠場語音識別等方面扮演了重要的角色。傳統的方法常用統計模型的VAD(VoiceActivityDetection,語音活動檢測器),這種方法可以區分出當前時間是否存在語音,但是需要的限制條件是在單個發聲源、穩定噪聲、高信噪比的情況下起效,而且沒有辦法利用空間信息判斷出當前的語音來自哪個方向。而且在遠場環境中,語音疊加上環境噪聲,相干噪聲以及混響后,會使得VAD的效果大大折扣。近年來研發了啟發式的基于信噪比的方法,參見引文(O.HoshuyamaArealtimerobustadaptivemicrophoneandcontrolledbyanSNRestimate,InProc.ICASSP1998,pp.3605-3608),該啟發式的基于信噪比的方法是用延遲求和的方法估計出目標方向語音,用自適應阻塞矩陣的方法估計出噪聲,然后用兩者的比值估計出信噪比,再利用一個估計的閾值來對信噪比做判決。其存在如下的問題:一、很難找到一個魯棒的閾值來判斷當前的信噪比應該歸類為語音還是噪聲;二、對于噪聲和目標方向語音的估計不夠準確;三、當存在不穩定噪聲時,雖然估計出低信噪比,但是實際上語音是存在的。即在不穩定噪聲情況下很容易失效。
技術實現思路
本專利技術的目的在于克服現有技術的缺陷,提供一種基于二階錐規劃的目標方向語音檢測方法,解決傳統方法中的VA ...
【技術保護點】
一種基于二階錐規劃的目標方向語音檢測方法,其特征在于,包括如下步驟:針對目標方向設計最低旁瓣的波束形成,利用二階錐規劃計算所述最低旁瓣的波束形成的權重;構造噪聲估計權重;利用麥克風形成的輸入信號、所述最低旁瓣的波束形成的權重以及所述噪聲估計權重計算得出目標信號和噪聲信號;利用時域一階遞歸平滑計算出目標信號和噪聲信號的功率;利用目標信號的功率和噪聲信號的功率計算出后驗信噪比;對所述后驗信噪比進行最小值跟蹤,以得到所述后驗信噪比的最小值;計算頻段在281.25Hz至3437.5Hz范圍內的后驗信噪比之和與后驗信噪比的最小值之和的比值;判斷計算得到的比值與設定閾值的大小以確定目標方向語音是否存在。
【技術特征摘要】
1.一種基于二階錐規劃的目標方向語音檢測方法,其特征在于,包括如下步驟:針對目標方向設計最低旁瓣的波束形成,利用二階錐規劃計算所述最低旁瓣的波束形成的權重;構造噪聲估計權重;利用麥克風形成的輸入信號、所述最低旁瓣的波束形成的權重以及所述噪聲估計權重計算得出目標信號和噪聲信號;利用時域一階遞歸平滑計算出目標信號和噪聲信號的功率;利用目標信號的功率和噪聲信號的功率計算出后驗信噪比;對所述后驗信噪比進行最小值跟蹤,以得到所述后驗信噪比的最小值;計算頻段在281.25Hz至3437.5Hz范圍內的后驗信噪比之和與后驗信噪比的最小值之和的比值;判斷計算得到的比值與設定閾值的大小以確定目標方向語音是否存在。2.如權利要求1所述的基于二階錐規劃的目標方向語音檢測方法,其特征在于,針對目標方向設計最低旁瓣的波束形成,利用二階錐規劃計算所述最低旁瓣的波束形成的權重,包括:構造自相關矩陣:R(i,j)=sinc(2fd/c)(式一)式一中,f為頻率,c為空氣中的聲音的傳播速度,d為第i個麥克風和第j個麥克風之間的距離;對式一中的R做Cholesky分解:R=VHV(式二)利用二階錐規劃求解所述最低旁瓣的波束形成的權重:s.t.式三中,w為最低旁瓣的波束形成的權重,α(θ)為目標方向的導向矢量,μ0表示范數約束值其取值為0.3,μ1表示旁瓣響應約束其取值為0.1,θSL為旁瓣方向,θs為旁瓣方向角度參數,H為共軛轉置操作。3.如權利要求2所述的基于二階錐規劃的目標方向語音檢測方法,其特征在于,構造噪聲估計權重,包括:設計約束使得主瓣方向增益為0以求解噪聲估計權重:s.t.式四中,wn為噪聲估計權重,μ表示主瓣響應其取值為0.1,θML是主瓣方向,θ為目標方向角度,w為最低旁瓣的...
【專利技術屬性】
技術研發人員:曹裕行,
申請(專利權)人:上海語知義信息技術有限公司,
類型:發明
國別省市:上海,31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。