本實用新型專利技術提供了一種集成遠場語音識別和聲場錄制的系統,系統包括麥克風陣列和數據處理終端,并具有遠場語音識別和聲場錄制兩種工作模式,麥克風陣列對聲音信號進行采集,數據處理終端連接麥克風陣列,接收麥克風陣列采集的聲音信號,并對聲音信號進行處理,實現遠場語音識別和聲場錄制。本實用新型專利技術可以工作于遠場語音識別和聲場錄制兩種模式,分別完成遠場語音識別功能和聲場錄制功能,利用一個麥克風陣列和一套系統即可同時實現遠場語音識別功能和聲場錄制功能,功能多樣,一機兩用,節約了設備成本;可以采用語音指令或者移動終端切換工作模式,切換方式靈活簡單,便于用戶操作。
【技術實現步驟摘要】
本技術總體上涉及語音處理
,尤其涉及集成遠場語音識別和聲場錄制的系統。
技術介紹
近幾年人工智能,人工智能的前端最重要的是信息的正確獲取,特別是音視頻技術受到格外關注,但與視頻技術的進步相比,雖說在近場單通道語音識別上獲得很大進展,已經達到非常高的正確識別率,但遠場語音交互技術還需要更大的發展,基于麥克風陣列的遠場語音識別是其中最關鍵的技術。同樣的,AR(AugmentedReality,增強現實)/VR(VirtualReality,虛擬現實)技術在近些年開始逐步走向應用,相對于視覺體驗,音頻體驗同樣相對滯后,其中一項重要的技術是原始聲場的采集與重現,利用麥克風技術陣列技術,同樣可以實現原始聲場的采集。但是現有產品及技術都是針對其中某項應用進行的設計,僅僅能實現遠場語音識別或者聲場錄制,而在實際應用過程中,例如在辦公場所或者家庭客廳中,一方面有遠場語音識別與控制的需求,例如利用遠場識別控制電視或者投影儀的操作燈;另一方面又有聲場錄制的需求,例如與遠方朋友或親人全息通話,或者會議室內的全息音視頻會議通訊等,現有技術并沒有能夠同時滿足上述兩種需求的系統。例如,亞馬遜推出的echo音箱利用麥克風陣列技術進行遠場語音采集。在音箱頂部布放了6+1個麥克風,其中6個麥克風均勻布放構成一個環形陣列,另外中心布放一個麥克風,利用麥克風陣列信號處理技術,實現遠場語音識別,但并沒有聲場錄音的功能。其他類似的智能音箱都采用了類似的方案,但都只實現遠場語音識別功能。1.2.2現有技術一的缺點又例如,CN104754471A利用麥克風陣列中的兩兩組合成新的麥克風對進行處理,計算獲得聲場各階分量,利用解碼矩陣合成各揚聲器激勵,從而重建二維聲場。但其只能進行聲場錄制,沒有遠場語音識別功能。
技術實現思路
(一)要解決的技術問題本技術提供了一種集成遠場語音識別和聲場錄制的系統,既能實現遠場語音識別,又能夠實現聲場錄制,并且能進行兩種模式的靈活切換。(二)技術方案本技術提供了一種集成遠場語音識別和聲場錄制的系統,包括:麥克風陣列和數據處理終端;其中,所述系統包括遠場語音識別和聲場錄制兩種工作模式;所述麥克風陣列對聲音信號進行采集;所述數據處理終端連接所述麥克風陣列,接收所述麥克風陣列采集的聲音信號,并對所述聲音信號進行處理,實現遠場語音識別和聲場錄制。優選地,所述麥克風陣列為圓形陣、矩形陣或橢圓形陣。優選地,所述麥克風陣列的麥克風數量大于等于4,麥克風之間的間距小于8cm。優選地,所述數據處理終端為計算機。優選地,當系統處于遠場語音識別工作模式時,所述麥克風陣列采集遠場語音信號,所述數據處理終端對所述遠場語音信號進行遠場語音識別;當系統處于聲場錄制工作模式時,所述麥克風陣列采集多通道音頻信號,所述數據處理終端對所述多聲道音頻信號進行聲場錄制。優選地,所述數據處理終端包括:語音控制模塊、遠場語音識別模塊和聲場錄制模塊;在所述語音控制模塊的控制下,所述遠場語音識別模塊對遠場語音信號進行遠場語音識別,系統進入遠場語音識別工作模式;在所述語音控制模塊的控制下,所述聲場錄制模塊對多聲道音頻信號進行聲場錄制,系統進入聲場錄制工作模式,實現工作模式的切換。優選地,還包括控制端;所述控制端為手機。優選地,所述數據處理終端包括遠程控制模塊,遠場語音識別模塊和聲場錄制模塊,所述遠程控制模塊與所述控制端無線連接;所述控制端向所述遠程控制模塊發送控制信號,在所述遠程控制模塊的控制下,所述遠場語音識別模塊對遠場語音信號進行遠場語音識別,系統進入遠場語音識別工作模式;所述控制端向所述遠程控制模塊發送控制信號,在所述遠程控制模塊的控制下,所述聲場錄制模塊對多聲道音頻信號進行聲場錄制,系統進入聲場錄制工作模式,實現工作模式的切換。優選地,所述遠場語音識別模塊為廣義旁瓣對消器。(三)有益效果從上述技術方案可以看出,本技術的集成遠場語音識別和聲場錄制的系統具有以下有益效果:(1)將遠場語音識別和聲場錄制集成在一個系統中,利用同一個小型麥克風陣列,即可實現遠場語音識別又可實現聲場錄制,相對于現有技術,只需一套系統即可同時實現遠場語音識別功能和聲場錄制功能,功能多樣,一機兩用,節約了設備成本;(2)可以采用語音指令或者移動終端切換工作模式,切換方式靈活簡單,便于用戶操作。附圖說明為了更完整地理解本技術及其優勢,現在將參考結合附圖的以下描述,其中:圖1為本技術實施例的集成遠場語音識別和聲場錄制的系統的結構示意圖;圖2為本技術實施例的集成遠場語音識別和聲場錄制的系統的處理流程圖;圖3為集成遠場語音識別和聲場錄制的流程圖。具體實施方式根據結合附圖對本技術示例性實施例的以下詳細描述,本技術的其它方面、優勢和突出特征對于本領域技術人員將變得顯而易見。在本技術中,術語“包括”和“含有”及其派生詞意為包括而非限制;術語“或”是包含性的,意為和/或。在本說明書中,下述用于描述本技術原理的各種實施例只是說明,不應該以任何方式解釋為限制技術的范圍。參照附圖的下述描述用于幫助全面理解由權利要求及其等同物限定的本技術的示例性實施例。下述描述包括多種具體細節來幫助理解,但這些細節應認為僅僅是示例性的。因此,本領域普通技術人員應認識到,在不背離本技術的范圍和精神的情況下,可以對本文中描述的實施例進行多種改變和修改。此外,為了清楚和簡潔起見,省略了公知功能和結構的描述。此外,貫穿附圖,相同參考數字用于相似功能和操作。本技術實施例提供了一種集成遠場語音識別和聲場錄制的系統,該系統可以工作于遠場語音識別和聲場錄制兩種模式,分別完成遠場語音識別功能和聲場錄制功能,如圖1所示,該系統包括:麥克風陣列和數據處理終端;其中,麥克風陣列包括四個麥克風構成的小型圓形陣列,麥克風陣列用于對聲音信號進行采集,當系統進行遠場語音識別時,麥克風陣列采集遠場語音信號,當系統進行聲場錄制時,麥克風陣列采集多通道音頻信號。數據處理終端連接麥克風陣列,接收麥克風陣列采集的聲音信號,并對聲音信號進行處理。數據處理終端具有遠場語音識別和聲場錄制兩種工作模式,當其工作于遠場語音識別模式時,對遠場語音信號進行遠場語音識別,當其工作于聲場錄制模式時,對多聲道音頻信號進行聲場錄制。由此可見,本技術將遠場語音識別和聲場錄制集成在一個系統中,利用同一個小型麥克風陣列,即可實現遠場語音識別又可實現聲場錄制,相對于現有技術,只需一套系統即可同時實現遠場語音識別功能和聲場錄制功能,功能多樣,一機兩用,節約了設備成本。在本技術中,數據處理終端可以是計算機等數據處理設備,包括:語音控制模塊、遠場語音識別模塊和聲場錄制模塊。用戶根據所需的應用場景和使用目的,可以通過語音切換數據處理終端的工作模式。例如,當需要進行遠場語音識別時,用戶可發出相應的語音指令,語音控制模塊接收語音指令,并根據語音指令生成控制信號,遠場語音識別模塊對遠場語音信號進行遠場語音識別,使數據處理終端工作于遠場語音識別模式。當需要進行全息音/視頻會議或環繞聲場采集時,用戶可發出相應的語音指令,語音控制模塊接收語音指令,并根據語音指令生成控制信號,聲場錄制模塊對多聲道音頻信號進行聲場錄制,使數據處理終本文檔來自技高網...

【技術保護點】
一種集成遠場語音識別和聲場錄制的系統,其特征在于,包括:麥克風陣列和數據處理終端;其中,所述系統包括遠場語音識別和聲場錄制兩種工作模式;所述麥克風陣列對聲音信號進行采集;所述數據處理終端連接所述麥克風陣列,接收所述麥克風陣列采集的聲音信號,并對所述聲音信號進行處理,實現遠場語音識別和聲場錄制。
【技術特征摘要】
1.一種集成遠場語音識別和聲場錄制的系統,其特征在于,包括:麥克風陣列和數據處理終端;其中,所述系統包括遠場語音識別和聲場錄制兩種工作模式;所述麥克風陣列對聲音信號進行采集;所述數據處理終端連接所述麥克風陣列,接收所述麥克風陣列采集的聲音信號,并對所述聲音信號進行處理,實現遠場語音識別和聲場錄制。2.如權利要求1所述的系統,其特征在于,所述麥克風陣列為圓形陣、矩形陣或橢圓形陣。3.如權利要求2所述的系統,其特征在于,所述麥克風陣列的麥克風數量大于等于4,麥克風之間的間距小于8cm。4.如權利要求1所述的系統,其特征在于,所述數據處理終端為計算機。5.如權利要求1所述的系統,其特征在于,當系統處于遠場語音識別工作模式時,所述麥克風陣列采集遠場語音信號,所述數據處理終端對所述遠場語音信號進行遠場語音識別;當系統處于聲場錄制工作模式時,所述麥克風陣列采集多通道音頻信號,所述數據處理終端對所述多聲道音頻信號進行聲場錄制。6.如權利要求5所述的系統,其特征在于,所述數據處理終端包括:語音控制模塊、遠場語音...
【專利技術屬性】
技術研發人員:陳日林,馮大航,陳孝良,蘇少煒,
申請(專利權)人:北京聲智科技有限公司,
類型:新型
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。