集成遠場語音識別和聲場錄制的系統技術方案

技術編號：15259157 閱讀：227 留言：0更新日期：2017-05-03 10:51

本實用新型專利技術提供了一種集成遠場語音識別和聲場錄制的系統，系統包括麥克風陣列和數據處理終端，并具有遠場語音識別和聲場錄制兩種工作模式，麥克風陣列對聲音信號進行采集，數據處理終端連接麥克風陣列，接收麥克風陣列采集的聲音信號，并對聲音信號進行處理，實現遠場語音識別和聲場錄制。本實用新型專利技術可以工作于遠場語音識別和聲場錄制兩種模式，分別完成遠場語音識別功能和聲場錄制功能，利用一個麥克風陣列和一套系統即可同時實現遠場語音識別功能和聲場錄制功能，功能多樣，一機兩用，節約了設備成本；可以采用語音指令或者移動終端切換工作模式，切換方式靈活簡單，便于用戶操作。

全部詳細技術資料下載

【技術實現步驟摘要】

本技術總體上涉及語音處理
，尤其涉及集成遠場語音識別和聲場錄制的系統。
技術介紹
近幾年人工智能，人工智能的前端最重要的是信息的正確獲取，特別是音視頻技術受到格外關注，但與視頻技術的進步相比，雖說在近場單通道語音識別上獲得很大進展，已經達到非常高的正確識別率，但遠場語音交互技術還需要更大的發展，基于麥克風陣列的遠場語音識別是其中最關鍵的技術。同樣的，AR(AugmentedReality，增強現實)/VR(VirtualReality，虛擬現實)技術在近些年開始逐步走向應用，相對于視覺體驗，音頻體驗同樣相對滯后，其中一項重要的技術是原始聲場的采集與重現，利用麥克風技術陣列技術，同樣可以實現原始聲場的采集。但是現有產品及技術都是針對其中某項應用進行的設計，僅僅能實現遠場語音識別或者聲場錄制，而在實際應用過程中，例如在辦公場所或者家庭客廳中，一方面有遠場語音識別與控制的需求，例如利用遠場識別控制電視或者投影儀的操作燈；另一方面又有聲場錄制的需求，例如與遠方朋友或親人全息通話，或者會議室內的全息音視頻會議通訊等，現有技術并沒有能夠同時滿足上述兩種需求的系統。例如，亞馬遜推出的echo音箱利用麥克風陣列技術進行遠場語音采集。在音箱頂部布放了6+1個麥克風，其中6個麥克風均勻布放構成一個環形陣列，另外中心布放一個麥克風，利用麥克風陣列信號處理技術，實現遠場語音識別，但并沒有聲場錄音的功能。其他類似的智能音箱都采用了類似的方案，但都只實現遠場語音識別功能。1.2.2現有技術一的缺點又例如，CN104754471A利用麥克風陣列中的兩兩組合成新的麥克風對進行處理...
集成遠場語音識別和聲場錄制的系統

【技術保護點】
一種集成遠場語音識別和聲場錄制的系統，其特征在于，包括：麥克風陣列和數據處理終端；其中，所述系統包括遠場語音識別和聲場錄制兩種工作模式；所述麥克風陣列對聲音信號進行采集；所述數據處理終端連接所述麥克風陣列，接收所述麥克風陣列采集的聲音信號，并對所述聲音信號進行處理，實現遠場語音識別和聲場錄制。

【技術特征摘要】
1.一種集成遠場語音識別和聲場錄制的系統，其特征在于，包括：麥克風陣列和數據處理終端；其中，所述系統包括遠場語音識別和聲場錄制兩種工作模式；所述麥克風陣列對聲音信號進行采集；所述數據處理終端連接所述麥克風陣列，接收所述麥克風陣列采集的聲音信號，并對所述聲音信號進行處理，實現遠場語音識別和聲場錄制。2.如權利要求1所述的系統，其特征在于，所述麥克風陣列為圓形陣、矩形陣或橢圓形陣。3.如權利要求2所述的系統，其特征在于，所述麥克風陣列的麥克風數量大于等于4，麥克風之間的間距小于8cm。4.如權利要求1所述的系統，其特征在于，所述數據處理終端為計算機。5.如權利要求1所述的系統，其特征在于，當系統處于遠場語音識別工作模式時，所述麥克風陣列采集遠場語音信號，所述數據處理終端對所述遠場語音信號進行遠場語音識別；當系統處于聲場錄制工作模式時，所述麥克風陣列采集多通道音頻信號，所述數據處理終端對所述多聲道音頻信號進行聲場錄制。6.如權利要求5所述的系統，其特征在于，所述數據處理終端包括：語音控制模塊、遠場語音...

【專利技術屬性】
技術研發人員：陳日林，馮大航，陳孝良，蘇少煒，
申請(專利權)人：北京聲智科技有限公司，
類型：新型
國別省市：北京;11

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術