音頻數據的處理方法、裝置、系統和電子設備制造方法及圖紙

技術編號：44491994 閱讀：4 留言：0更新日期：2025-03-04 17:57

本公開提供了一種音頻數據的處理方法、裝置、系統、電子設備、計算機可讀存儲介質及計算機程序產品，涉及語音識別、人機語音交互、智能座艙等人工智能技術領域。該方法可應用于第一終端，包括：確定第一音頻數據中喚醒指令的定位信息；對第一音頻數據進行標記處理，得到帶有時間標記信息的第二音頻數據；根據定位信息和第二音頻數據中的時間標記信息，確定喚醒指令在第二音頻數據中的位置信息；輸出第二音頻數據以及位置信息。提高了語音喚醒的成功率。

全部詳細技術資料下載

【技術實現步驟摘要】

本公開涉及語音識別、人機語音交互、智能座艙等人工智能，尤其涉及一種音頻數據的處理方法、裝置、系統、電子設備、計算機可讀存儲介質及計算機程序產品。

技術介紹

1、隨著語音識別技術的不斷發展，人機交互得到了更廣泛的應用，例如車載智能語音終端、智能家居等等。車載終端可以對用戶輸入的語音信息進行識別，在識別出喚醒詞后進入激活狀態，并根據識別出的語音指令提供相應的服務，例如可在保證安全行駛的前提下為用戶提供諸如導航、多媒體播放等服務。

技術實現思路

1、本公開實施例提出了一種音頻數據的處理方法、裝置、系統、電子設備、計算機可讀存儲介質及計算機程序產品，可以提高語音喚醒的成功率。

2、第一方面，本公開實施例提出了一種音頻數據的處理方法，應用于第一終端，包括：確定第一音頻數據中喚醒指令的定位信息；對第一音頻數據進行標記處理，得到帶有時間標記信息的第二音頻數據；根據定位信息和第二音頻數據中的時間標記信息，確定喚醒指令在第二音頻數據中的位置信息；輸出第二音頻數據以及位置信息。

3、第二方面，本公開實施例還提出了另一種音頻數據的處理方法，應用于第二終端，包括：接收帶有時間標記信息的第二音頻數據，以及喚醒指令在第二音頻數據中的位置信息；根據位置信息對第二音頻數據進行語音識別；響應于識別出喚醒指令，觸發進入喚醒激活狀態。

4、第三方面，本公開實施例提出了一種音頻數據的處理裝置，包括：定位信息確定模塊，被配置為確定第一音頻數據中喚醒指令的定位信息；標記處理模塊，被配置為對

5、第四方面，本公開實施例還提出了另一種音頻數據的處理裝置，包括：第二接口模塊，被配置為接收帶有時間標記信息的第二音頻數據，以及喚醒指令在第二音頻數據中的位置信息；語音喚醒模塊，被配置為根據位置信息對第二音頻數據進行語音識別；喚醒觸發模塊，被配置為響應于識別出喚醒指令，觸發進入喚醒激活狀態；其中，喚醒指令在第二音頻數據中的位置信息包括喚醒指令中的特定詞在第二音頻數據中的位置信息，特定詞包括起始字、關鍵字、結束字中的至少一種；時間標記信息包括第二音頻數據中的音頻幀對應的時間戳。

6、第五方面，本公開實施例提供了一種音頻數據的處理系統，該系統包括第一終端和第二終端，其中，第一終端包括如第三方面中任一實現方式描述的音頻數據的處理裝置；第二終端包括如第四方面中任一實現方式描述的音頻數據的處理裝置。

7、第六方面，本公開實施例提供了一種電子設備，該電子設備包括：至少一個處理器；以及與至少一個處理器通信連接的存儲器；其中，存儲器存儲有可被至少一個處理器執行的指令，該指令被至少一個處理器執行，以使至少一個處理器執行時能夠實現如第一方面或第二方面中任一實現方式描述的音頻數據的處理方法。

8、第七方面，本公開實施例提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質，該計算機指令用于使計算機執行時能夠實現如第一方面或第二方面中任一實現方式描述的音頻數據的處理方法。

9、第八方面，本公開實施例提供了一種包括計算機程序的計算機程序產品，該計算機程序在被處理器執行時能夠實現如第一方面或第二方面中任一實現方式描述的音頻數據的處理方法。

10、應當理解，本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征，也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。

本文檔來自技高網...

【技術保護點】

1.一種音頻數據的處理方法，應用于第一終端，包括：

2.根據權利要求1所述的方法，還包括：

3.根據權利要求2所述的方法，其中，所述確定第一音頻數據中的喚醒指令的定位信息包括：

4.根據權利要求3所述的方法，其中，所述特定詞包括起始字、關鍵字、結束字中的至少一種。

5.根據權利要求3所述的方法，其中，所述對所述第一音頻數據進行標記處理，得到帶有時間標記信息的第二音頻數據包括：

6.根據權利要求4所述的方法，其中，對所述第一音頻數據進行標記處理包括：

7.根據權利要求5所述的方法，還包括：

8.根據權利要求7所述的方法，其中，所述第一進程將所述定位信息以及所述第二音頻數據傳輸給運行于所述第一終端的第二進程包括：

9.根據權利要求7或8所述的方法，其中，所述輸出所述第二音頻數據以及所述位置信息包括：

10.根據權利要求9所述的方法，還包括：

11.根據權利要求9所述的方法，還包括：

12.一種音頻數據的處理方法，應用于第二終端，包括：

13.

14.根據權利要求12所述的方法，其中，所述喚醒指令在所述第二音頻數據中的位置信息包括所述喚醒指令中的特定詞在所述第二音頻數據中的位置信息，所述特定詞包括起始字、關鍵字、結束字中的至少一種；

15.根據權利要求12-14中任一項所述的方法，還包括：

16.一種音頻數據的處理裝置，應用于第一終端，包括：

17.根據權利要求16所述的處理裝置，還包括：

18.根據權利要求17所述的處理裝置，其中，

19.根據權利要求17所述的處理裝置，其中，所述定位信息確定模塊確定的所述喚醒指令的定位信息包括所述喚醒指令中的特定詞對應的時間戳，其中所述特定詞包括起始字、關鍵字、結束字中的至少一種。

20.根據權利要求19所述的處理裝置，還包括：

21.根據權利要求20所述的處理裝置，其中，所述傳輸模塊進一步被配置為基于安卓接口定義語言協議將所述定位信息以及所述第二音頻數據傳輸給所述第二進程。

22.根據權利要求19-21中任一項所述的處理裝置，其中，所述位置信息確定模塊進一步被配置為通過所述第二進程根據所述定位信息和所述第二音頻數據中的所述時間標記信息，確定所述喚醒指令在所述第二音頻數據中的位置信息，所述位置信息包括所述喚醒指令中的所述特定詞在所述第二音頻數據中的位置信息。

23.根據權利要求19-21中任一項所述的處理裝置，其中，

24.根據權利要求16所述的處理裝置，還包括交互模塊，

25.一種音頻數據的處理裝置，應用于第二終端，包括：

26.根據權利要求25所述的處理裝置，還包括校驗模塊，

27.根據權利要求25或26所述的處理裝置，其中，

28.一種音頻數據的處理系統，包括第一終端和第二終端，其中，

29.根據權利要求28所述的處理系統，其中，所述第一終端包括車載終端，所述第二終端包括移動終端，所述第一進程包括車載語音識別進程，所述第二進程包括行車輔助進程，所述行車輔助進程將所述第二音頻數據以及所述喚醒指令的位置信息輸出至所述移動終端上的行車輔助程序。

30.一種電子設備，包括：

31.一種存儲有計算機指令的非瞬時計算機可讀存儲介質，所述計算機指令用于使所述計算機執行權利要求1-11中任一項所述的音頻數據的處理方法、或者執行權利要求12-15中任一項所述的音頻數據的處理方法。

32.一種計算機程序產品，包括計算機程序，所述計算機程序被處理器執行時實現根據權利要求1-11中任一項所述的音頻數據的處理方法的步驟、或者根據權利要求12-15中任一項所述的音頻數據的處理方法的步驟。

...

【技術特征摘要】

1.一種音頻數據的處理方法，應用于第一終端，包括：

2.根據權利要求1所述的方法，還包括：

3.根據權利要求2所述的方法，其中，所述確定第一音頻數據中的喚醒指令的定位信息包括：

4.根據權利要求3所述的方法，其中，所述特定詞包括起始字、關鍵字、結束字中的至少一種。

5.根據權利要求3所述的方法，其中，所述對所述第一音頻數據進行標記處理，得到帶有時間標記信息的第二音頻數據包括：

6.根據權利要求4所述的方法，其中，對所述第一音頻數據進行標記處理包括：

7.根據權利要求5所述的方法，還包括：

8.根據權利要求7所述的方法，其中，所述第一進程將所述定位信息以及所述第二音頻數據傳輸給運行于所述第一終端的第二進程包括：

9.根據權利要求7或8所述的方法，其中，所述輸出所述第二音頻數據以及所述位置信息包括：

10.根據權利要求9所述的方法，還包括：

11.根據權利要求9所述的方法，還包括：

12.一種音頻數據的處理方法，應用于第二終端，包括：

13.根據權利要求12所述的方法，其中，所述根據所述位置信息對所述第二音頻數據進行語音識別包括：

15.根據權利要求12-14中任一項所述的方法，還包括：

16.一種音頻數據的處理裝置，應用于第一終端，包括：

17.根據權利要求16所述的處理裝置，還包括：

18.根據權利要求17所述的處理裝置，其中，

19.根據權利要求17所述的處理裝置，其中，所述定位信息確定模塊確定的所述喚醒指令的定位信息包括所述喚醒指令中的特定詞對應的時間戳，其中所述特定詞包括...

【專利技術屬性】
技術研發人員：左聲勇，
申請(專利權)人：阿波羅智聯北京科技有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術