System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及語音交互,特別涉及一種語音交互方法、服務器及計算機可讀存儲介質。
技術介紹
1、隨著用戶需求的提出及自然語言處理技術的發展,車輛座艙空間內的語音交互功能得到廣泛應用和迅速發展,用戶可通過語音指令控制車輛。然而,用戶通過語音指令控制車輛時,表述的語音指令可能被座艙空間內其他聲音干擾,使得車輛未能正確理解語音指令,導致語音交互失敗。
技術實現思路
1、本申請提供一種語音交互方法、服務器及計算機可讀存儲介質。
2、本申請實施方式提供一種語音交互方法,包括:
3、接收車輛轉發的當前語音請求;
4、根據所述當前語音請求,確定當前對話輪次的第一對話文本;
5、根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,其中,所述第二對話文本為所述當前對話輪次的前一對話輪次的語音請求;
6、向所述車輛發送所述應用程序接口參數填充的執行結果,以完成所述語音交互。
7、在本申請實施方式提供的語音交互方法中,服務器可接收車輛轉發的當前語音請求,并根據當前語音請求,確定當前對話輪次的第一對話文本,再根據當前語音請求、當前對話輪次的第一對話文本、前一對話輪次的第二對話文本以及第二對話文本的自然語言理解結果,對第一對話文本進行應用程序接口預測,和對預測出的應用程序接口進行參數填充,及向車輛發送應用程序接口參數填充的執行結果,以完成語音
8、如此,在本申請實施方式中,使當前對話輪次的第一對話文本的處理可基于當前語音請求、第一對話文本、當前對話輪次的第一對話文本、前一對話輪次的第二對話文本以及第二對話文本的自然語言理解結果執行,實現有基于上下文和多模態信息的自然語言處理,且在一定程度上保障有第一對話文本的應用程序預測和參數填充的可靠與準確,使得用戶對于語音交互功能的使用體驗得以提高。
9、在本申請某些實施方式中,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
10、對所述第一對話文本、第二對話文本、所述第二對話文本的自然語言理解結果進行拼接,得到第一嵌入向量;
11、根據所述當前語音請求確定第二嵌入向量;
12、根據所述第二嵌入向量和所述第二嵌入向量,對所述第一對話文本進行所述應用程序接口預測和所述應用程序接口參數填充。
13、如此,在本申請實施方式中,可對第一對話文本、第二對話文本及第二對話文本的自然語言理解結果進行拼接以得到第一嵌入向量,并可對當前語音請求進行編碼以得到第二嵌入向量,及通過第二嵌入向量和第一嵌入向量進行第一對話文本的應用程序接口預測和接口參數填充。
14、在本申請某些實施方式中,所述根據所述當前語音請求確定第二嵌入向量,包括:
15、對所述當前語音請求進行編碼處理,得到音頻編碼結果;
16、根據所述第一嵌入向量,對所述音頻編碼結果進行投影處理,得到所述第二嵌入向量。
17、如此,在本申請實施方式中,使得服務器可對當前語音請求進行編碼處理以得到音頻編碼結果,并根據第一嵌入向量對音頻編碼結果進行投影處理以得到第二嵌入向量。
18、在本申請某些實施方式中,所述方法還包括:
19、配置所述第一嵌入向量中每個參數的第一標簽,其中,所述第一標簽用于指示所述參數對應的對話輪次。
20、如此,在本申請實施方式中,使得服務器可對第一嵌入向量中各個參數進行第一標簽的配置處理,使第一嵌入向量中屬于當前對話輪次的參數與屬于上一對話輪次的參數之間可基于第一標簽區分。
21、在本申請某些實施方式中,所述方法還包括:
22、配置所述第一嵌入向量中每個參數的第二標簽,其中,所述第二標簽用于指示所述參數在所述第一嵌入向量中的位置。
23、如此,在本申請實施方式中,可配置第一嵌入向量中各個參數的第二標簽,使得第一嵌入向量中各個參數可基于第二標簽區分和關聯,進而可在一定程度上提高應用程序接口預測和參數填充的準確程度。
24、在本申請某些實施方式中,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
25、根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,及確定所述第一對話文本對應的喚醒標簽;
26、所述向所述車輛發送所述應用程序接口參數填充的執行結果,以完成所述語音交互,包括:
27、向所述車輛發送所述執行結果和所述喚醒標簽,以完成所述語音交互。
28、如此,在本申請實施方式中,使得服務器可通過當前語音請求、第一對話文本、第二對話文本以及第二對話文本的自然語言理解結果,推理第一對話文本對應的喚醒標簽,及可將喚醒標簽下發給車輛,以使車輛可通過喚醒標簽執行相應動作。
29、在本申請某些實施方式中,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
30、對所述第一對話文本進行槽位識別;
31、根據所述當前語音請求、所述第一對話文本、所述槽位識別的結果、所述第二對話文本、所述第二對話文本的自然語言理解結果,對所述第一對話文本進行所述應用程序接口預測和所述應用程序接口參數填充。
32、如此,在本申請實施方式中,使得服務器可對第一對話文本進行槽位識別,及通過第一對話文本的槽位識別結果,進行第一語言請求的應用程序接口預測和應用程序接口參數填充。
33、在本申請某些實施方式中,所述根據所述當前語音請求、所述第一對話文本、所述槽位識別的結果、所述第二對話文本、所述第二對話文本的自然語言理解結果,對所述第一對話文本進行所述應用程序接口預測和所述應用程序接口參數填充,包括:
34、根據所述當前語音請求、所述第一對話文本、所述槽位識別的結果、所述第二對話文本、所述第二對話文本的自然語言理解結果,對所述第一對話文本進行所述應用程序接口預測;
35、根據所述槽位識別的結果和所述自然語言理解結果,執行應用程序接口預測結果的所述應用程序接口參數填充,得到所述執行結果。
36、如此,在本申請實施方式中,使得服務器可通過第一對話文本的槽位識別結果,以及第二語義請求的自然語言理解結果,執行第一對話文本的應用程序預測,及執行針對于應用程序預測結果的參數填充。
37、本申請實施方式提供一種服務器,包括存儲器和處理器,所述存本文檔來自技高網...
【技術保護點】
1.一種語音交互方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述當前語音請求確定第二嵌入向量,包括:
4.根據權利要求2所述的方法,其特征在于,所述方法還包括:
5.根據權利要求2所述的方法,其特征在于,所述方法還包括:
6.根據權利要求1所述的方法,其特征在于,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
7.根據權利要求1所述的方法,其特征在于,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
8.根據權利要求7所述的方法,其
9.一種服務器,其特征在于,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述計算機程序被所述處理器執行時,實現權利要求1-8任意一項所述的方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,當所述計算機程序被一個或多個處理器執行時,實現權利要求1-8任意一項所述的方法。
...【技術特征摘要】
1.一種語音交互方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述當前語音請求確定第二嵌入向量,包括:
4.根據權利要求2所述的方法,其特征在于,所述方法還包括:
5.根據權利要求2所述的方法,其特征在于,所述方法還包括:
6.根據權利要求1所述的方法,其特征在于,所述根據所述當前語音請求、所述第一對話文本、第二對話文本以及所述第二對話文本的自然語言理解結果,對所述第一對話文本進行應用程序接口預測和應用程序接口參數填充,包括:
7.根據權利要求1所述的方法...
【專利技術屬性】
技術研發人員:朱麒宇,寧洪珂,樊駿鋒,趙群,
申請(專利權)人:廣州小鵬汽車科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。