無需注冊的個性化語音增強制造技術

技術編號：44370036 閱讀：4 留言：0更新日期：2025-02-25 09:48

公開了用于在語音通信系統中使語音增強組件個性化而無需注冊的系統、方法和計算機可讀存儲設備。一種方法包括：接收音頻數據，所述音頻數據包括語音，并且所述音頻數據要由至少一個語音增強組件處理；在不要求用戶注冊的情況下，確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者；以及基于確定所述音頻數據的所述語音包括近場語音和遠場語音中的一項或者包括近場語音和遠場語音兩者，改變所述至少一個語音增強組件中的一個或多個語音增強組件。

全部詳細技術資料下載

【技術實現步驟摘要】
【國外來華專利技術】

本公開涉及通過減少回聲、噪聲、去混響等來增強語音。具體地，本公開涉及語音通信系統中的個性化語音增強，而不要求用戶注冊(enroll)。

技術介紹

1、在語音通信系統中，音頻信號可能受到回聲、背景噪聲、混響、增強算法、網絡損傷等的影響。試圖向其客戶提供最佳且可靠的服務的語音通信系統的提供商可以估計音頻信號的感知質量。例如，語音質量預測在網絡設計和開發期間以及對于監視和改進客戶的體驗質量(qoe)可能是有用的。

2、為了改進用戶的qoe，語音增強組件對于電信至關重要，其用于減少回聲、噪聲、去混響等。這些語音增強組件中的許多可以基于聲學數字信號處理(adsp)算法、深度學習組件，和/或基于客戶的特定訓練進行個性化。adsp算法的問題是它們沒有針對各個客戶進行個性化。深度學習語音增強組件的問題是它們僅與用于訓練它們的數據一樣好，并且數據可能沒有針對各個客戶進行個性化。

3、個性化語音增強的益處是其針對特定客戶，并且這種系統可以去除不是客戶語音的任何聲音，包括語音。然而，某些當前的個性化語音增強組件要求客戶注冊和/或訓練語音增強組件，這可能花費大量時間、大量存儲器和/或大量處理。例如，某些當前的個性化語音增強組件要求客戶說出幾個句子來表征他們的話音。注冊的一個大問題是非常少的客戶自己注冊個性化語音增強。

4、因此，需要不要求注冊(例如，訓練)的個性化語音增強組件，其自動改進客戶的qoe而無需客戶的主動參與。

技術實現思路

1、根據特定實施例，公開了用于在語

2、根據特定實施例，公開了一種用于在語音通信系統中使語音增強組件個性化而無需注冊的計算機實現的方法。一種方法，包括：接收音頻數據，所述音頻數據包括語音，并且所述音頻數據要由至少一個語音增強組件處理；在不要求用戶注冊的情況下，確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者；以及基于確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者，改變所述至少一個語音增強組件中的一個或多個語音增強組件。

3、根據特定實施例，公開了一種用于在語音通信系統中使語音增強組件個性化而無需注冊的系統。一種系統，包括：數據存儲設備，其存儲用于在語音通信系統中使語音增強組件個性化而無需注冊的指令；以及處理器，其被配置為執行指令以實施方法，所述方法包括：接收音頻數據，所述音頻數據包括語音，并且所述音頻數據要由至少一個語音增強組件處理；在不要求用戶注冊的情況下，確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者；以及基于確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者，改變所述至少一個語音增強組件中的一個或多個語音增強組件。

4、根據特定實施例，公開了一種存儲指令的計算機可讀存儲設備，所述指令在由計算機執行時，使所述計算機實施用于在語音通信系統中使語音增強組件個性化而無需注冊的方法。計算機可讀存儲設備的一種方法包括：接收音頻數據，所述音頻數據包括語音，并且所述音頻數據要由至少一個語音增強組件處理；在不要求用戶注冊的情況下，確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者；以及基于確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者，改變所述至少一個語音增強組件中的一個或多個語音增強組件。

5、所公開的實施例的附加目的和優點的一部分將在下面的描述中闡述，并且一部分將從描述中顯而易見，或者可以通過實踐所公開的實施例來學習。所公開的實施例的目的和優點將借助于所附權利要求中特別指出的元素和組合來實現和獲得。

6、應當理解，前述一般描述和以下詳細描述都僅是示例性和說明性的，并且不限制所要求保護的所公開的實施例。

本文檔來自技高網...

【技術保護點】

1.一種用于在語音通信系統中使語音增強組件個性化而無需注冊的計算機實現的方法，所述方法包括：

2.根據權利要求1所述的方法，其中，改變所述至少一個語音增強組件中的所述一個或多個語音增強組件包括：

3.根據權利要求1所述的方法，其中，改變所述至少一個語音增強組件中的一個或多個語音增強組件包括：

4.根據權利要求2所述的方法，其中，所述對應的個性化語音增強組件中的每個個性化語音增強組件是已經使用遠場語音被訓練的神經網絡模型。

5.根據權利要求4所述的方法，其中，使用經訓練的神經網絡模型的所述個性化語音增強組件是個性化噪聲抑制組件，所述個性化噪聲抑制組件使用僅具有近場語音作為干凈語音的數據集并且添加僅具有遠場語音作為干擾項的數據集，以訓練個性化噪聲抑制組件神經網絡來對遠場語音進行噪聲抑制。

6.根據權利要求1所述的方法，其中，確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者包括以下中的一項或兩項：

7.根據權利要求6所述的方法，還包括：

8.根據權利要求6所述的方法，還包括：

9.根據權利要求1所述的方法，其中，確定所述音頻數據的所述語音是包括近場語音和遠場語音中的一項還是包括近場語音和遠場語音兩者包括：

10.一種用于在語音通信系統中使語音增強組件個性化而無需注冊的系統，所述系統包括：

11.根據權利要求10所述的系統，其中，改變所述至少一個語音增強組件中的所述一個或多個語音增強組件包括：

12.根據權利要求10所述的系統，其中，改變所述至少一個語音增強組件中的一個或多個語音增強組件包括：

13.根據權利要求11所述的系統，其中，所述對應的個性化語音增強組件中的每個個性化語音增強組件是已經使用遠場語音被訓練的神經網絡模型。

14.一種存儲指令的計算機可讀存儲設備，所述指令在由計算機執行時，使所述計算機實施用于在語音通信系統中使語音增強組件個性化而無需注冊的方法，所述方法包括：

15.根據權利要求14所述的計算機可讀存儲設備，其中，改變所述至少一個語音增強組件中的所述一個或多個語音增強組件包括：

...

【技術特征摘要】
【國外來華專利技術】

1.一種用于在語音通信系統中使語音增強組件個性化而無需注冊的計算機實現的方法，所述方法包括：

2.根據權利要求1所述的方法，其中，改變所述至少一個語音增強組件中的所述一個或多個語音增強組件包括：

3.根據權利要求1所述的方法，其中，改變所述至少一個語音增強組件中的一個或多個語音增強組件包括：

4.根據權利要求2所述的方法，其中，所述對應的個性化語音增強組件中的每個個性化語音增強組件是已經使用遠場語音被訓練的神經網絡模型。

7.根據權利要求6所述的方法，還包括：

<...

【專利技術屬性】
技術研發人員：R·G·卡特勒，
申請(專利權)人：微軟技術許可有限責任公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術