System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,尤其涉及一種數據處理方法、裝置、存儲介質及電子設備。
技術介紹
1、目前主流的人機交互系統,比如對話系統(谷歌assistate、百度小度等),主要通過把語音對話轉換成文本后,再對文本進行識別,基于識別結果來執行一些操作,比如打開空調,播放音樂等,實現機器與人類的自然語言交互,這是一種典型的單模態交互方式。
2、然而,多模態交互才是人機交互最自然的方式,但是,現有的人機交互系統,在對多模態交互數據處理識別時,識別精準性較低,識別效果差。
技術實現思路
1、本專利技術提供一種數據處理方法、裝置、存儲介質及電子設備,能提供識別精準性較高的對話處理模型。
2、本申請實施例提供了一種數據處理方法,包括:
3、獲取對話樣本,所述對話樣本中包括多個對話語句;
4、根據所述對話樣本確定每個所述對話語句對應的內容特征、以及所述多個對話語句之間的對話關聯特征;
5、根據所述內容特征和所述對話關聯特征,構建所述對話樣本對應的目標圖結構;
6、利用所述目標圖結構對預設模型進行訓練,得到已訓練模型。
7、本申請實施例還提供了一種數據處理裝置,包括:
8、獲取模塊,用于獲取對話樣本,所述對話樣本中包括多個對話語句;
9、確定模塊,用于根據所述對話樣本確定每個所述對話語句對應的內容特征、以及所述多個對話語句之間的對話關聯特征;
10、構建模塊,用于根據所述內容特征和所
11、訓練模塊,用于利用所述目標圖結構對預設模型進行訓練,得到已訓練模型。
12、在一些實施方式中,所述對話樣本為視頻樣本,所述確定模塊具體用于:
13、從所述視頻樣本中提取出每個所述對話語句對應的子視頻;
14、根據所述子視頻確定所述對話語句對應的文本特征、音頻特征和圖像特征;
15、對所述文本特征、所述音頻特征和所述圖像特征中的至少兩個進行拼接,得到所述內容特征,每個所述對話語句對應一個所述內容特征。
16、在一些實施方式中,所述構建模塊具體用于:
17、將每個所述內容特征作為一個節點;
18、根據所述對話關聯特征,從所有所述節點中確定每個所述節點對應的關聯節點;
19、將各個所述節點與對應的所述關聯節點進行連接,以構建所述對話樣本對應的目標圖結構。
20、在一些實施方式中,所述對話關聯特征包括對話順序和對話邏輯關系,所述構建模塊具體用于:
21、按照所述對話順序對各個所述節點進行排序;
22、獲取任意兩個處于相鄰排序位置的所述節點,且將后一排序位置處的所述節點作為前一排序位置處的所述節點的關聯節點;
23、獲取任意兩個不處于相鄰排序位置且對應的所述對話邏輯關系指示為回應關系的所述節點,且將所述回應關系中被回應方對應的所述節點,作為回應方對應的所述節點的關聯節點。
24、在一些實施方式中,所述構建模塊具體用于:
25、通過有向連接邊,將各個所述節點與對應的所述關聯節點進行連接,得到所述對話樣本對應的圖結構,其中,所述有向連接邊包括箭頭端和非箭頭端,且各個所述節點處,所述箭頭端連接對應的所述關聯節點;
26、根據所述圖結構確定目標圖結構。
27、在一些實施方式中,所述構建模塊具體用于:
28、統計所述圖結構中每個所述節點的出度值和入度值,所述出度值為對應節點連接的所述非箭頭端的個數,所述入度值為對應節點連接的所述箭頭端的個數;
29、根據所述出度值和所述入度值對所述圖結構進行更新,得到目標圖結構。
30、在一些實施方式中,所述構建模塊具體用于:
31、當所述出度值和所述入度值之間的第一差值等于第一閾值時,將對應節點、以及與對應節點連接的所述有向連接邊進行刪除;
32、當所述入度值小于第二閾值,且所述出度值大于或等于第三閾值時,從與對應節點連接的所述有向連接邊中,選取至少一條所述有向連接邊進行刪除,所述第一閾值小于所述第二閾值,且小于所述第三閾值。
33、在一些實施方式中,所述構建模塊具體用于:
34、確定與對應節點連接的其它的所有所述節點,作為候選節點;
35、計算每個所述候選節點的所述入度值和所述出度值之間的第二差值;
36、按照所述第二差值從小到大的順序,依次刪除對應節點與所述候選節點之間的所述有向連接邊,直至對應節點的所述出度值等于所述第三閾值。
37、在一些實施方式中,所述預設模型包括特征增強模型和分類模型,該獲取模塊還用于:獲取所述對話樣本中每個所述對話語句對應的分類標簽;
38、所述訓練模塊具體用于:利用所述目標圖結構和所述分類標簽,對所述特征增強模型和所述分類模型進行訓練。
39、在一些實施方式中,所述訓練模塊具體用于:
40、將所述目標圖結構輸入所述特征增強模型中,得到增強特征信息;
41、將所述增強特征信息輸入所述分類模型中,得到預測結果;
42、確定所述預測結果和所述分類標簽之間的誤差值;
43、根據所述誤差值反向調整所述特征增強模型和所述分類模型。
44、在一些實施方式中,所述分類模型包括情緒分類模型和意圖分類模型,該數據處理裝置還包括識別模塊,用于:
45、獲取待識別的對話數據;
46、基于所述已訓練模型對所述對話數據進行識別,得到目標情緒信息和目標意圖信息。
47、本申請實施例還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有多條指令,所述指令適于由處理器加載以執行上述任一項數據處理方法。
48、本申請實施例還提供了一種電子設備,包括耦合的存儲器和處理器,所述存儲器存儲內有計算機程序,所述處理器用于運行所述存儲器內的所述計算機程序,以執行上述任一項數據處理方法。
49、本申請提供的數據處理方法、裝置、存儲介質及電子設備,通過獲取對話樣本,對話樣本中包括多個對話語句,并根據對話樣本確定每個對話語句對應的內容特征和多個對話語句之間的對話關聯特征,之后,根據內容特征和對話關聯特征,構建對話樣本對應的目標圖結構,之后,利用目標圖結構對預設模型進行訓練,從而能結合對話內容和對話關聯關系進行模型訓練,有效提高模型對對話的識別能力,進而提高人機交互效果。
本文檔來自技高網...【技術保護點】
1.一種數據處理方法,其特征在于,包括:
2.根據權利要求1所述的數據處理方法,其特征在于,所述對話樣本為視頻樣本,所述根據所述對話樣本確定每個所述對話語句對應的內容特征,包括:
3.根據權利要求1所述的數據處理方法,其特征在于,所述根據所述內容特征和所述對話關聯特征,構建所述對話樣本對應的目標圖結構,包括:
4.根據權利要求3所述的數據處理方法,其特征在于,所述對話關聯特征包括對話順序和對話邏輯關系,所述根據所述對話關聯特征,從所有所述節點中確定每個所述節點對應的關聯節點,包括:
5.根據權利要求3所述的數據處理方法,其特征在于,所述將各個所述節點與對應的所述關聯節點進行連接,以構建所述對話樣本對應的目標圖結構,包括:
6.根據權利要求5所述的數據處理方法,其特征在于,所述根據所述圖結構確定目標圖結構,包括:
7.根據權利要求6所述的數據處理方法,其特征在于,所述根據所述出度值和所述入度值對所述圖結構進行更新,包括:
8.根據權利要求7所述的數據處理方法,其特征在于,所述從與對應節點連接的所述有
9.根據權利要求1-8任一項所述的數據處理方法,其特征在于,所述預設模型包括特征增強模型和分類模型,在利用所述目標圖結構對預設模型進行訓練之前,還包括:
10.根據權利要求9所述的數據處理方法,其特征在于,所述利用所述目標圖結構和所述分類標簽,對所述特征增強模型和所述分類模型進行訓練,包括:
11.根據權利要求9所述的數據處理方法,其特征在于,所述分類模型包括情緒分類模型和意圖分類模型,在根據所述目標圖結構對預設模型進行訓練之后,還包括:
12.一種數據處理裝置,其特征在于,包括:
13.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有多條指令,所述指令適于由處理器加載以執行權利要求1至11中任一項所述的數據處理方法。
14.一種電子設備,其特征在于,包括耦合的存儲器和處理器,所述存儲器存儲內有計算機程序,所述處理器用于運行所述存儲器內的所述計算機程序,以執行權利要求1至11中任一項所述的數據處理方法中的步驟。
...【技術特征摘要】
1.一種數據處理方法,其特征在于,包括:
2.根據權利要求1所述的數據處理方法,其特征在于,所述對話樣本為視頻樣本,所述根據所述對話樣本確定每個所述對話語句對應的內容特征,包括:
3.根據權利要求1所述的數據處理方法,其特征在于,所述根據所述內容特征和所述對話關聯特征,構建所述對話樣本對應的目標圖結構,包括:
4.根據權利要求3所述的數據處理方法,其特征在于,所述對話關聯特征包括對話順序和對話邏輯關系,所述根據所述對話關聯特征,從所有所述節點中確定每個所述節點對應的關聯節點,包括:
5.根據權利要求3所述的數據處理方法,其特征在于,所述將各個所述節點與對應的所述關聯節點進行連接,以構建所述對話樣本對應的目標圖結構,包括:
6.根據權利要求5所述的數據處理方法,其特征在于,所述根據所述圖結構確定目標圖結構,包括:
7.根據權利要求6所述的數據處理方法,其特征在于,所述根據所述出度值和所述入度值對所述圖結構進行更新,包括:
8.根據權利要求7所述的數據處理方法,其特征在于,所述從與對應節點...
【專利技術屬性】
技術研發人員:曹源,
申請(專利權)人:TCL科技集團股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。