System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,尤其涉及一種交互問答方法、裝置、電子設備和存儲介質。
技術介紹
1、在當今的數字化時代,人機交互問答系統已成為獲取信息、解決問題的重要工具,廣泛應用于教育、醫療、客戶服務、智能家居以及娛樂等多個領域。這些系統通過自然語言處理技術,旨在識別用戶的意圖,提供準確、及時的回答或執行相應的操作。
2、然而,自然語言本身具有復雜性和多樣性,用戶的提問方式可能因文化背景、教育程度、個人習慣等因素而異,使得系統難以準確捕捉用戶的真實意圖。例如,用戶可能使用口語化的表達、指代性的表達等,在實際運行過程中,相關問答系統在識別用戶意圖并進行交互時,經常面臨理解偏差的問題,這對用戶的交互體驗構成了顯著的影響。
技術實現思路
1、本專利技術提供一種交互問答方法、裝置、電子設備和存儲介質,用以解決現有技術中識別用戶意圖并進行交互時,面臨理解偏差影響用戶交互體驗的缺陷。
2、本專利技術提供一種交互問答方法,包括:
3、獲取提問指令,以及包含指向性物體的圖像;
4、將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,并基于所述指代對象生成回答文本;
5、基于所述回答文本,進行交互問答。
6、根據本專利技術提供的交互問答方法,所述將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,包括:
7、對所述圖像進行對象檢測,得到所述指向性物體以
8、基于所述指向性物體以及各對象的位置,將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象。
9、根據本專利技術提供的交互問答方法,所述基于所述指向性物體以及各對象的位置,將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,包括:
10、基于所述指向性物體以及各對象的位置,確定所述指向性物體與各對象之間的距離,以及所述指向性物體的指示方向;
11、基于所述距離以及所述指示方向,將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象。
12、根據本專利技術提供的交互問答方法,所述基于所述回答文本,進行交互問答,包括:
13、基于所述提問指令,預測所述回答文本中包含的情感狀態;
14、基于所述回答文本和所述情感狀態進行語音合成,得到回答語音;
15、基于所述回答語音,進行交互問答。
16、根據本專利技術提供的交互問答方法,所述方法還包括:
17、在當前提問指令中不包含指代詞,或基于歷史問答已知當前提問指令中指代詞的指代對象的情況下,基于語音大模型、所述當前提問指令和當前圖像,進行交互問答。
18、根據本專利技術提供的交互問答方法,所述將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,并基于所述指代對象生成回答文本,包括:
19、基于多模理解大模型,將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,并基于所述指代對象生成回答文本,所述多模理解大模型是基于樣本提問指令和樣本圖像,對大型語言模型進行分階段訓練得到的。
20、根據本專利技術提供的交互問答方法,所述提問指令包括文本指令或語音指令,所述圖像包括單張圖像、單場景下包含動態指向性物體的多張圖像、跨場景下包含動態指向性物體的多張圖像、具有語義關聯關系的多張視頻幀。
21、本專利技術還提供一種交互問答裝置,包括:
22、獲取單元,用于獲取提問指令,以及包含指向性物體的圖像;
23、生成單元,用于將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,并基于所述指代對象生成回答文本;
24、交互單元,用于基于所述回答文本,進行交互問答。
25、本專利技術還提供一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述任一種所述交互問答方法。
26、本專利技術還提供一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現如上述任一種所述交互問答方法。
27、本專利技術還提供一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現如上述任一種所述交互問答方法。
28、本專利技術提供的交互問答方法、裝置、電子設備和存儲介質,通過將提問指令中的指代詞與指向性物體所指示的具體對象進行關聯,能夠精細化的識別理解用戶的指代式問題,從而正確理解用戶意圖,通過智能解析指代詞,確保多模態信息的對齊,使得回答內容更加貼近人類對話的自然邏輯,提升交互的流暢度和用戶體驗。
本文檔來自技高網...【技術保護點】
1.一種交互問答方法,其特征在于,包括:
2.根據權利要求1所述的交互問答方法,其特征在于,所述將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,包括:
3.根據權利要求2所述的交互問答方法,其特征在于,所述基于所述指向性物體以及各對象的位置,將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,包括:
4.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述基于所述回答文本,進行交互問答,包括:
5.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述方法還包括:
6.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,并基于所述指代對象生成回答文本,包括:
7.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述提問指令包括文本指令或語音指令,所述圖像包括單張圖像、單場景下包含動態指向性物體的多張圖像、跨場景
8.一種交互問答裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1至7任一項所述交互問答方法。
10.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述交互問答方法。
...【技術特征摘要】
1.一種交互問答方法,其特征在于,包括:
2.根據權利要求1所述的交互問答方法,其特征在于,所述將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,包括:
3.根據權利要求2所述的交互問答方法,其特征在于,所述基于所述指向性物體以及各對象的位置,將所述提問指令中的指代詞與所述指向性物體所指示的對象進行關聯,得到所述指代詞的指代對象,包括:
4.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述基于所述回答文本,進行交互問答,包括:
5.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述方法還包括:
6.根據權利要求1至3中任一項所述的交互問答方法,其特征在于,所述將所述提問指令中的指代詞與所述指向性...
【專利技術屬性】
技術研發人員:殷保才,柏航,盛典,甘文君,董健,劉文超,殷兵,
申請(專利權)人:科大訊飛股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。