翻譯機及音頻翻譯系統技術方案

技術編號：44032685 閱讀：1 留言：0更新日期：2025-01-15 01:12

本申請公開了一種翻譯機及音頻翻譯系統，翻譯機同時采用多個不同的處理器分別執行不同的任務，如通過移動通信模塊實現音頻的收發處理，通過數字信號處理器執行音頻相關算法的處理，通過神經網絡處理器搭載離線翻譯引擎，實現對音頻高效的翻譯，通過主控處理器控制其它各個處理器。本申請將音頻鏈路的控制邏輯和具體算法處理邏輯進行了分離搭載，通過多處理器協調，有效降低通話翻譯的時延。在音頻數據流轉路徑設計上，移動通信模塊接收的遠端音頻直接送入數字信號處理器進行處理，無需經過主控處理器的中轉，數字信號處理器在得到第一目標音頻后直接送入播放模塊輸出播放，也無需經過主控處理器的中轉，進一步提升處理速度，降低時延。

全部詳細技術資料下載

【技術實現步驟摘要】

本申請涉及音頻處理，更具體的說，是涉及一種翻譯機及音頻翻譯系統。

技術介紹

1、現有的翻譯機多專注于翻譯的功能，如用翻譯機實現同聲傳譯功能，作為面對面溝通的設備等。

2、部分翻譯機搭載了通話翻譯系統，當監聽到來電或撥號時，啟動通話翻譯過程，能夠將遠端語音翻譯成本地語種的語音之后輸出，以及將本地語音翻譯成遠端語種的語音后再發送出去。但是，上述通話翻譯過程涉及對語音數據的處理，當前翻譯機的音頻數據處理鏈路不夠優化，導致搭載通話翻譯系統的翻譯機難以滿足低時延的通話翻譯需求。

技術實現思路

1、鑒于上述問題，提出了本申請以便提供一種音頻翻譯方法及系統，解決手機、電腦等終端需要翻譯語音的問題，擴大翻譯機的使用場景。具體方案如下：

2、第一方面，提供了一種翻譯機，包括：

3、移動通信模塊、主控處理器、數字信號處理器、神經網絡處理器、收音模塊及播放模塊；

4、所述移動通信模塊，用于建立與遠端手機間的通信鏈路，實現音頻的接收及發送，接收到的遠端音頻直接送入所述數字信號處理器；

5、所述主控處理器，用于控制其它處理器的工作；

6、所述數字信號處理器，用于在所述主控處理器的控制下，對所述遠端音頻進行預處理，以及，對所述遠端音頻對應的翻譯后文本進行語音合成，基于合成語音得到第一目標音頻，將所述第一目標音頻送入所述播放模塊輸出；

7、所述神經網絡處理器，用于搭載離線翻譯引擎，在所述主控處理器選擇離線翻譯的情況下，通過所述離

8、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，所述數字信號處理器，還用于在所述主控處理器的控制下，對所述收音模塊采集的本地音頻進行預處理，以及，對所述本地音頻對應的翻譯后文本進行語音合成，基于合成語音得到第二目標音頻，將所述第二目標音頻通過所述移動通信模塊發送至遠端手機；

9、所述神經網絡處理器，還用于在所述主控處理器選擇離線翻譯的情況下，通過所述離線翻譯引擎對預處理后的本地音頻進行翻譯，得到與所述遠端音頻相同語種的翻譯后文本，將翻譯后文本送入所述數字信號處理器進行語音合成。

10、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，所述數字信號處理器對所述遠端音頻對應的翻譯后文本進行語音合成，基于合成語音得到第一目標音頻的過程，包括：

11、所述數字信號處理器對所述遠端音頻對應的翻譯后文本進行語音合成，將合成語音作為第一目標音頻；

12、或，

13、所述數字信號處理器對所述遠端音頻對應的翻譯后文本進行語音合成，將合成語音和所述遠端音頻進行拼接，得到第一目標音頻。

14、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，所述數字信號處理器對所述本地音頻對應的翻譯后文本進行語音合成，基于合成語音得到第二目標音頻的過程，包括：

15、所述數字信號處理器對所述本地音頻對應的翻譯后文本進行語音合成，將合成語音作為第二目標音頻；

16、或，

17、所述數字信號處理器對所述本地音頻對應的翻譯后文本進行語音合成，將合成語音和所述本地音頻進行拼接，得到第二目標音頻。

18、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，所述神經網絡處理器，還用于在所述主控處理器選擇在線翻譯的情況下，調用翻譯服務器對預處理后的遠端音頻進行翻譯，得到目標語種的翻譯后文本，將翻譯后文本送入所述數字信號處理器進行語音合成。

19、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，所述神經網絡處理器，還用于在所述主控處理器選擇在線翻譯的情況下，調用翻譯服務器對預處理后的本地音頻進行翻譯，得到與所述遠端音頻相同語種的翻譯后文本，將翻譯后文本送入所述數字信號處理器進行語音合成。

20、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，所述預處理至少包括如下一種：降噪處理、回聲消除處理、自適應增益處理。

21、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，還包括：

22、應用處理器，用于搭載翻譯機應用，并在所述主控處理器的控制下工作。

23、在一種可能的設計中，在本申請實施例的第一方面的另一種實現方式中，還包括：

24、圖形處理器，用于在所述主控處理器的控制下，執行與圖形、圖像處理相關的工作。

25、第二方面，提供了一種音頻翻譯系統，包括：遠端手機，以及本申請第一方面任一項提供的翻譯機。

26、借由上述技術方案，本申請對具備通話翻譯功能的翻譯機的音頻處理鏈路進行改進，翻譯機同時采用多個不同的處理器以分別執行不同的任務處理，如通過移動通信模塊實現音頻的收發處理，通過數字信號處理器專門執行音頻相關算法的處理，如音頻預處理、語音合成等，通過神經網絡處理器搭載離線翻譯引擎，借助神經網絡處理器的性能可以提升翻譯引擎的翻譯效率，實現對音頻高效的翻譯處理，此外，還設計了主控處理器，主控處理器用于協調、控制其它各個處理器，也即將音頻鏈路的控制邏輯和具體算法處理邏輯進行了分離搭載，通過多處理器協調加速音頻翻譯處理速度，有效降低通話翻譯的時延。

27、此外，在音頻數據流轉路徑設計上，移動通信模塊接收的遠端音頻直接送入數字信號處理器進行處理，無需經過主控處理器的中轉。以及，數字信號處理器在得到第一目標音頻后直接送入播放模塊輸出播放，也無需經過主控處理器的中轉，如此可以進一步提升處理速度，降低時延。

本文檔來自技高網...

【技術保護點】

1.一種翻譯機，其特征在于，包括：

2.根據權利要求1所述的翻譯機，其特征在于，所述數字信號處理器，還用于在所述主控處理器的控制下，對所述收音模塊采集的本地音頻進行預處理，以及，對所述本地音頻對應的翻譯后文本進行語音合成，基于合成語音得到第二目標音頻，將所述第二目標音頻通過所述移動通信模塊發送至遠端手機；

3.根據權利要求1所述的翻譯機，其特征在于，所述數字信號處理器對所述遠端音頻對應的翻譯后文本進行語音合成，基于合成語音得到第一目標音頻的過程，包括：

4.根據權利要求2所述的翻譯機，其特征在于，所述數字信號處理器對所述本地音頻對應的翻譯后文本進行語音合成，基于合成語音得到第二目標音頻的過程，包括：

5.根據權利要求1所述的翻譯機，其特征在于，所述神經網絡處理器，還用于在所述主控處理器選擇在線翻譯的情況下，調用翻譯服務器對預處理后的遠端音頻進行翻譯，得到目標語種的翻譯后文本，將翻譯后文本送入所述數字信號處理器進行語音合成。

6.根據權利要求2所述的翻譯機，其特征在于，所述神經網絡處理器，還用于在所述主控處理器選擇在線翻譯

7.根據權利要求1或2所述的翻譯機，其特征在于，所述預處理至少包括如下一種：降噪處理、回聲消除處理、自適應增益處理。

8.根據權利要求1所述的翻譯機，其特征在于，還包括：

9.根據權利要求1所述的翻譯機，其特征在于，還包括：

10.一種音頻翻譯系統，其特征在于，包括：遠端手機，以及權利要求1-9任一項的翻譯機。

...

【技術特征摘要】

1.一種翻譯機，其特征在于，包括：

5.根據權利要求1所述的翻譯機，其特征在于，所述神經網絡處理器，還用于在所述主控處理器選擇在線...

【專利技術屬性】
技術研發人員：李想，余曉明，
申請(專利權)人：科大訊飛股份有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術