System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能,尤其涉及一種基于對話的意圖識別方法和裝置、計算機設備及存儲介質。
技術介紹
1、對話意圖識別是識別對話中每一輪對話中的用戶意圖,對話意圖識別通常應用于智能問答領域,以便于智能機器人進行答復時,可以快速輸出符合用戶意圖的答復語句。
2、相關技術中,對話意圖識別受到角色和輪次信息的影響,通常做對話意圖識別時會采用多個編碼網絡分別對句子、角色信息和輪次信息編碼,再將角色表征和輪次表征融入到句子信息中。但是,采用多個編碼網絡完成句子、角色信息和輪次信息的編碼處理,不僅增加了模型的復雜性,還會增加對話意圖識別過程的計算量,影響對話意圖識別的效率。因此,如何提高對話意圖識別的效率,成為了亟待解決的技術問題。
技術實現思路
1、本申請實施例的主要目的在于提出一種基于對話的意圖識別方法和裝置、計算機設備及存儲介質,旨在提高對話意圖識別的效率。
2、為實現上述目的,本申請實施例的第一方面提出了一種基于對話的意圖識別方法,所述方法包括:
3、獲取原始對話數據;其中,所述原始對話數據包括:至少兩個原始對話語句和每一所述原始對話語句的角色信息和輪次信息;
4、根據預設的對話截取參數對所述至少兩個原始對話語句進行對話截取,得到至少兩個候選對話語句組;其中,每一所述候選對話語句組包括至少兩個候選對話語句,且相鄰兩個的所述候選對話語句組之間存在重疊的所述候選對話語句;
5、將所述角色信息和所述輪次信息補充至所述候選對話語句,得到目標
6、對所述目標對話語句進行編碼處理,得到目標對話編碼數據;
7、對所述目標對話編碼數據進行意圖識別,得到所述目標對話語句的候選對話意圖信息和所述候選對話意圖信息的識別概率;其中,所述識別概率表征所述候選對話意圖信息的識別準確程度;
8、根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息。
9、在一些實施例,所述對話截取參數包括:至少一個預設滑動窗口和預設重疊句子數量;所述根據預設的對話截取參數對所述至少兩個原始對話語句進行對話截取,得到至少兩個候選對話語句組,包括:
10、根據每一所述預設滑動窗口對所述至少兩個原始對話語句進行對話截取,得到初步對話語句組;
11、根據所述預設重疊句子數量對每一所述預設滑動窗口進行窗口調節,得到更新滑動窗口;
12、根據所述更新滑動窗口對所述初步對話語句組進行對話語句調整,得到更新對話語句組;
13、將所述更新對話語句組進行拼接,得到至少兩個所述候選對話語句組。
14、在一些實施例,在所述根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息之后,所述方法還包括:
15、根據預設的意圖驗證信息和所述目標對話意圖信息進行損失計算,得到意圖識別損失數據;
16、根據所述意圖識別損失數據對所述預設重疊句子數量進行調整,得到更新重疊句子數量;
17、根據所述更新重疊句子數量對所述候選對話語句組進行調節處理,得到優化對話語句組。
18、在一些實施例,所述將所述角色信息和所述輪次信息補充至所述候選對話語句,得到目標對話語句,包括:
19、根據所述角色信息生成角色標識;
20、根據所述輪次信息生成輪次標識;
21、對所述候選對話語句進行插入定位,得到插入定位信息;
22、根據所述插入定位信息將所述角色標識、所述輪次標識補充至所述候選對話語句,得到所述目標對話語句。
23、在一些實施例,所述對所述目標對話語句進行編碼處理,得到目標對話編碼數據,包括:
24、對所述目標對話語句進行分解處理,得到分解詞語;
25、對每一所述分解詞語進行編碼處理,得到初步編碼數據;其中,所述初步編碼數據包括:角色編碼信息、輪次編碼信息、上下文編碼信息和詞編碼信息;
26、將所述角色編碼信息、所述輪次編碼信息和所述上下文編碼信息進行融合處理,得到目標編碼信息;
27、將所述目標編碼信息和所述詞編碼信息進行拼接處理,得到所述目標對話編碼數據。
28、在一些實施例,所述根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息,包括:
29、將同一所述目標對話語句的所述識別概率進行累加計算,得到目標概率;
30、根據所述目標概率從所述候選對話意圖信息中篩選出所述目標對話語句的所述目標對話意圖信息。
31、在一些實施例,所述對所述目標對話編碼數據進行意圖識別,得到所述目標對話語句的候選對話意圖信息和所述候選對話意圖信息的識別概率,包括:
32、基于所述目標對話編碼數據進行意圖分類處理,得到所述候選對話意圖信息;
33、對所述候選對話意圖信息進行識別準確性評估,得到所述候選對話意圖信息的識別概率。
34、為實現上述目的,本申請實施例的第二方面提出了一種基于對話的意圖識別裝置,所述裝置包括:
35、數據獲取模塊,用于獲取原始對話數據;其中,所述原始對話數據包括:至少兩個原始對話語句和每一所述原始對話語句的角色信息和輪次信息;
36、對話截取模塊,用于根據預設的對話截取參數對所述至少兩個原始對話語句進行對話截取,得到至少兩個候選對話語句組;其中,每一所述候選對話語句組包括至少兩個候選對話語句,且相鄰兩個的所述候選對話語句組之間存在重疊的所述候選對話語句;
37、補充模塊,用于將所述角色信息和所述輪次信息補充至所述候選對話語句,得到目標對話語句;
38、編碼模塊,用于對所述目標對話語句進行編碼處理,得到目標對話編碼數據;
39、意圖識別模塊,用于對所述目標對話編碼數據進行意圖識別,得到所述目標對話語句的候選對話意圖信息和所述候選對話意圖信息的識別概率;其中,所述識別概率表征所述候選對話意圖信息的識別準確程度;
40、信息篩選模塊,用于根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息。
41、為實現上述目的,本申請實施例的第三方面提出了一種計算機設備,所述計算機設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現上述第一方面所述的方法。
42、為實現上述目的,本申請實施例的第四方面提出了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述第一方面所述的方法。
43、本申請提出的基于對話的意圖識別方法和裝置、計算機設備及存儲介質,其通過根據預設的對話截取參數對至少兩個原始對話語句中截取出至少兩個候選對話語句組,且相鄰的候選對話語句組之間存在重疊的候選對話語句,對每一候選對話語句組做意圖識別可以保留上下文的連續性本文檔來自技高網...
【技術保護點】
1.一種基于對話的意圖識別方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述對話截取參數包括:至少一個預設滑動窗口和預設重疊句子數量;所述根據預設的對話截取參數對所述至少兩個原始對話語句進行對話截取,得到至少兩個候選對話語句組,包括:
3.根據權利要求2所述的方法,其特征在于,在所述根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息之后,所述方法還包括:
4.根據權利要求1至3任一項所述的方法,其特征在于,所述將所述角色信息和所述輪次信息補充至所述候選對話語句,得到目標對話語句,包括:
5.根據權利要求1至3任一項所述的方法,其特征在于,所述對所述目標對話語句進行編碼處理,得到目標對話編碼數據,包括:
6.根據權利要求1至3任一項所述的方法,其特征在于,所述根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息,包括:
7.根據權利要求1至3任一項所述的方法,其特征在于,所述對所述目標對話編碼數據進行意圖識別,得到所述目標對
8.一種基于對話的意圖識別裝置,其特征在于,所述裝置包括:
9.一種計算機設備,其特征在于,所述計算機設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現權利要求1至7任一項所述的基于對話的意圖識別方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的基于對話的意圖識別方法。
...【技術特征摘要】
1.一種基于對話的意圖識別方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述對話截取參數包括:至少一個預設滑動窗口和預設重疊句子數量;所述根據預設的對話截取參數對所述至少兩個原始對話語句進行對話截取,得到至少兩個候選對話語句組,包括:
3.根據權利要求2所述的方法,其特征在于,在所述根據所述識別概率從所述候選對話意圖信息中篩選出所述目標對話語句的目標對話意圖信息之后,所述方法還包括:
4.根據權利要求1至3任一項所述的方法,其特征在于,所述將所述角色信息和所述輪次信息補充至所述候選對話語句,得到目標對話語句,包括:
5.根據權利要求1至3任一項所述的方法,其特征在于,所述對所述目標對話語句進行編碼處理,得到目標對話編碼數據,包括:
6.根據權利要求1至3...
【專利技術屬性】
技術研發人員:陶清,曾冠榮,馬駿,王少軍,
申請(專利權)人:平安科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。