System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及人工智能,尤其涉及一種確定回答信息的方法、裝置、程序產(chǎn)品及設(shè)備。
技術(shù)介紹
1、檢索增強(qiáng)生成(retrieval?augmented?generation,rag)是將信息檢索技術(shù)與大語(yǔ)言模型等人工智能模型結(jié)合的技術(shù)。rag技術(shù)的基本原理為:在人工智能模型需要生成用戶問(wèn)題的回答時(shí),先使用檢索技術(shù)從知識(shí)庫(kù)中檢索出與問(wèn)題相關(guān)的知識(shí)信息,然后人工智能模型在基于自身的知識(shí)和推理能力的前提下,還會(huì)結(jié)合檢索到的知識(shí)信息,生成回答信息。
2、基于rag技術(shù)能夠在一定程度上降低人工智能模型存在的知識(shí)幻覺(jué)問(wèn)題,所謂知識(shí)幻覺(jué)是指人工智能模型生成與現(xiàn)實(shí)不符的錯(cuò)誤信息。但是,受限于檢索技術(shù)的局限性,目前經(jīng)常會(huì)從知識(shí)庫(kù)中檢測(cè)出無(wú)法有效用于解答用戶問(wèn)題的知識(shí)信息,從而使得人工智能模型依賴檢索出的知識(shí)信息,無(wú)法準(zhǔn)確確定用戶問(wèn)題對(duì)應(yīng)的回答信息,使得人工智能模型確定出的回答信息的準(zhǔn)確度較低,甚至可能出現(xiàn)知識(shí)幻覺(jué)。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問(wèn)題,本申請(qǐng)?zhí)峁┝艘环N確定回答信息的方法和裝置,以提高利用人工智能模型確定出的回答信息的準(zhǔn)確性,減少人工智能模型出現(xiàn)知識(shí)幻覺(jué)的情況。具體方案如下:
2、本申請(qǐng)第一方面提供一種確定回答信息的方法,包括:
3、獲得用戶輸入的目標(biāo)問(wèn)題信息;
4、確定知識(shí)庫(kù)中與所述目標(biāo)問(wèn)題信息匹配的至少一個(gè)知識(shí)片段;
5、對(duì)于每個(gè)知識(shí)片段,基于所述知識(shí)片段和所述目標(biāo)問(wèn)題信息,利用拒答檢測(cè)模型確定所述知識(shí)片段的拒答檢測(cè)結(jié)果,所述拒答檢測(cè)
6、從所述至少一個(gè)知識(shí)片段中,篩選出所述拒答檢測(cè)結(jié)果為目標(biāo)結(jié)果的至少一個(gè)有效知識(shí)片段,其中,知識(shí)片段的拒答檢測(cè)結(jié)果為目標(biāo)結(jié)果表明基于所述知識(shí)片段能夠得到所述目標(biāo)問(wèn)題信息的回答信息;
7、利用所述至少一個(gè)有效知識(shí)片段,利用第一智能問(wèn)答模型確定所述目標(biāo)問(wèn)題信息的目標(biāo)回答信息。
8、在一種可能的實(shí)現(xiàn)中,所述基于所述知識(shí)片段和所述目標(biāo)問(wèn)題信息,利用拒答檢測(cè)模型確定所述知識(shí)片段的拒答檢測(cè)結(jié)果,包括:
9、基于所述知識(shí)片段和目標(biāo)問(wèn)題信息,構(gòu)建提示信息,所述提示信息用于提示拒答檢測(cè)模型基于所述知識(shí)片段生成所述目標(biāo)問(wèn)題信息的回答;
10、基于所述提示信息,利用所述拒答檢測(cè)模型輸出所述目標(biāo)問(wèn)題信息的回答結(jié)果,得到采用所述回答結(jié)果表示的拒答檢測(cè)結(jié)果;
11、其中,如果所述回答結(jié)果是無(wú)法回答,所述拒答檢測(cè)結(jié)果表明基于所述知識(shí)片段無(wú)法得到所述目標(biāo)問(wèn)題信息的回答信息;如果所述回答結(jié)果不是無(wú)法回答,所述拒答檢測(cè)結(jié)果表明基于所述知識(shí)片段能夠得到所述目標(biāo)問(wèn)題信息的回答信息。
12、在又一種可能的實(shí)現(xiàn)中,所述確定知識(shí)庫(kù)中與所述目標(biāo)問(wèn)題信息匹配的至少一個(gè)知識(shí)片段,包括:
13、從知識(shí)庫(kù)中檢索出與所述目標(biāo)問(wèn)題信息的相似度較高的前目標(biāo)數(shù)量個(gè)待定知識(shí)片段;
14、從所述目標(biāo)數(shù)量個(gè)待定知識(shí)片段中,確定出與所述目標(biāo)問(wèn)題信息的相似度不小于設(shè)定閾值的至少一個(gè)知識(shí)片段。
15、在一種可能的實(shí)現(xiàn)中,所述拒答檢測(cè)模型為以多個(gè)知識(shí)片段樣本以及所述知識(shí)片段樣本對(duì)應(yīng)的問(wèn)答樣本對(duì)中的問(wèn)題樣本為訓(xùn)練樣本,以所述問(wèn)答樣本對(duì)中的回答樣本為所述問(wèn)答樣本對(duì)中問(wèn)題樣本的標(biāo)簽,對(duì)第二智能問(wèn)答模型進(jìn)行訓(xùn)練得到的,所述第二智能問(wèn)答模型與第一智能問(wèn)答模型為相同類型的模型;
16、其中,所述知識(shí)片段樣本對(duì)應(yīng)的問(wèn)答樣本對(duì)為基于所述知識(shí)片段樣本,利用第二智能問(wèn)答模型生成的包括問(wèn)題樣本和回答樣本的樣本對(duì);
17、所述多個(gè)知識(shí)片段樣本對(duì)應(yīng)的問(wèn)答樣本對(duì)中包括:至少一個(gè)對(duì)應(yīng)的回答樣本的內(nèi)容是無(wú)法回答的問(wèn)答樣本對(duì),以及至少一個(gè)對(duì)應(yīng)的回答樣本的內(nèi)容不是無(wú)法回答的問(wèn)答樣本對(duì)。
18、在又一種可能的實(shí)現(xiàn)中,所述多個(gè)知識(shí)片段樣本包括:來(lái)自所述知識(shí)庫(kù)且屬于目標(biāo)行業(yè)領(lǐng)域的至少一個(gè)目標(biāo)知識(shí)片段樣本;
19、其中,所述至少一個(gè)目標(biāo)知識(shí)片段樣本通過(guò)如下方式得到:
20、獲得屬于目標(biāo)行業(yè)領(lǐng)域的至少一篇參考文檔,將所述參考文檔進(jìn)行片段拆分,得到所述至少一篇參考文檔拆分出的至少一個(gè)參考知識(shí)片段;
21、針對(duì)每個(gè)參考知識(shí)片段,利用所述第二智能問(wèn)答模型生成與所述參考知識(shí)片段相關(guān)的至少一個(gè)參考問(wèn)答對(duì),所述參考問(wèn)答對(duì)包括參考問(wèn)題和參考回答;
22、對(duì)于每個(gè)參考問(wèn)答對(duì),從所述知識(shí)庫(kù)中檢測(cè)出與所述參考問(wèn)答對(duì)中的參考問(wèn)題匹配的前指定數(shù)量個(gè)目標(biāo)知識(shí)片段樣本。
23、在又一種可能的實(shí)現(xiàn)中,所述指定數(shù)量為大于1的自然數(shù);
24、所述目標(biāo)知識(shí)片段樣本對(duì)應(yīng)的問(wèn)答樣本對(duì)通過(guò)如下方式得到:
25、對(duì)于每個(gè)參考問(wèn)答對(duì),基于與所述參考問(wèn)答對(duì)中的參考問(wèn)題匹配的前指定數(shù)量個(gè)目標(biāo)知識(shí)片段樣本,利用第二智能問(wèn)答模型構(gòu)建與所述前指定數(shù)量個(gè)目標(biāo)知識(shí)片段樣本相關(guān)的至少一個(gè)候選問(wèn)答對(duì),所述候選問(wèn)答對(duì)包括候選問(wèn)題和候選回答;
26、對(duì)于每個(gè)目標(biāo)知識(shí)片段樣本相關(guān)的每個(gè)候選問(wèn)答對(duì),基于所述目標(biāo)知識(shí)片段樣本,利用第二智能問(wèn)答模型確定候選問(wèn)答樣本對(duì)中的候選問(wèn)題對(duì)應(yīng)的輸出回答,將所述候選問(wèn)答對(duì)中的候選問(wèn)題和所述輸出回答構(gòu)成的問(wèn)答對(duì)確定為所述目標(biāo)知識(shí)片段樣本的問(wèn)答樣本對(duì)。
27、在又一種可能的實(shí)現(xiàn)中,所述拒答檢測(cè)模型通過(guò)如下方式訓(xùn)練得到:
28、獲得多個(gè)知識(shí)片段樣本以及所述知識(shí)片段樣本對(duì)應(yīng)的至少一個(gè)問(wèn)答樣本對(duì);
29、對(duì)于每個(gè)知識(shí)片段樣本對(duì)應(yīng)的每個(gè)問(wèn)答樣本對(duì),基于所述知識(shí)片段樣本和所述問(wèn)答樣本對(duì)中問(wèn)題樣本,構(gòu)建提示信息樣本,所述提示信息樣本用于提示第二智能問(wèn)答模型基于所述知識(shí)片段樣本,確定所述問(wèn)答樣本對(duì)中的問(wèn)題樣本對(duì)應(yīng)的回答;
30、基于所述提示信息樣本,利用第二智能問(wèn)答模型確定所述問(wèn)題樣本對(duì)應(yīng)的預(yù)測(cè)回答;
31、如果基于各問(wèn)答樣本對(duì)對(duì)應(yīng)的回答樣本和預(yù)測(cè)回答確定尚未達(dá)到所述第二智能問(wèn)答模型的訓(xùn)練要求,調(diào)整所述第二智能問(wèn)答模型的模型參數(shù);
32、基于調(diào)整后的第二智能問(wèn)答模型,返回執(zhí)行所述基于所述提示信息樣本,利用第二智能問(wèn)答模型確定所述問(wèn)題樣本的預(yù)測(cè)回答的操作,直至基于各問(wèn)答樣本對(duì)對(duì)應(yīng)的回答樣本和預(yù)測(cè)回答確定達(dá)到所述第二智能問(wèn)答模型的訓(xùn)練要求,將訓(xùn)練得到的第二智能問(wèn)答模型確定為拒答檢測(cè)模型。
33、本申請(qǐng)第二方面提供了一種確定回答信息的裝置,包括:
34、問(wèn)題獲得單元,用于獲得用戶輸入的目標(biāo)問(wèn)題信息;
35、知識(shí)匹配單元,用于確定知識(shí)庫(kù)中與所述目標(biāo)問(wèn)題信息匹配的至少一個(gè)知識(shí)片段;
36、拒答預(yù)檢單元,用于對(duì)于每個(gè)知識(shí)片段,基于所述知識(shí)片段和所述目標(biāo)問(wèn)題信息,利用拒答檢測(cè)模型確定所述知識(shí)片段的拒答檢測(cè)結(jié)果,所述拒答檢測(cè)結(jié)果用于表征基于所述知識(shí)片段是否能夠得到所述目標(biāo)問(wèn)題信息的回答信息;
37、知識(shí)篩選單元,用于從所述至少一個(gè)知識(shí)片段中,篩選出所述拒答檢測(cè)結(jié)果為目標(biāo)結(jié)果的至少本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種確定回答信息的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的確定回答信息的方法,其特征在于,所述基于所述知識(shí)片段和所述目標(biāo)問(wèn)題信息,利用拒答檢測(cè)模型確定所述知識(shí)片段的拒答檢測(cè)結(jié)果,包括:
3.根據(jù)權(quán)利要求1所述的確定回答信息的方法,其特征在于,所述確定知識(shí)庫(kù)中與所述目標(biāo)問(wèn)題信息匹配的至少一個(gè)知識(shí)片段,包括:
4.根據(jù)權(quán)利要求1或2所述的確定回答信息的方法,其特征在于,所述拒答檢測(cè)模型為以多個(gè)知識(shí)片段樣本以及所述知識(shí)片段樣本對(duì)應(yīng)的問(wèn)答樣本對(duì)中的問(wèn)題樣本為訓(xùn)練樣本,以所述問(wèn)答樣本對(duì)中的回答樣本為所述問(wèn)答樣本對(duì)中問(wèn)題樣本的標(biāo)簽,對(duì)第二智能問(wèn)答模型進(jìn)行訓(xùn)練得到的,所述第二智能問(wèn)答模型與第一智能問(wèn)答模型為相同類型的模型;
5.根據(jù)權(quán)利要求4所述的確定回答信息的方法,其特征在于,所述多個(gè)知識(shí)片段樣本包括:來(lái)自所述知識(shí)庫(kù)且屬于目標(biāo)行業(yè)領(lǐng)域的至少一個(gè)目標(biāo)知識(shí)片段樣本;
6.根據(jù)權(quán)利要求5所述的確定回答信息的方法,其特征在于,所述指定數(shù)量為大于1的自然數(shù);
7.根據(jù)權(quán)利要求4所述的確定回答信息的方法,其特征在于,所
8.一種確定回答信息的裝置,其特征在于,包括:
9.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)可讀指令,當(dāng)所述計(jì)算機(jī)可讀指令在電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的確定回答信息的方法。
10.一種電子設(shè)備,其特征在于,包括至少一個(gè)處理器和與所述處理器連接的存儲(chǔ)器,其中:
...【技術(shù)特征摘要】
1.一種確定回答信息的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的確定回答信息的方法,其特征在于,所述基于所述知識(shí)片段和所述目標(biāo)問(wèn)題信息,利用拒答檢測(cè)模型確定所述知識(shí)片段的拒答檢測(cè)結(jié)果,包括:
3.根據(jù)權(quán)利要求1所述的確定回答信息的方法,其特征在于,所述確定知識(shí)庫(kù)中與所述目標(biāo)問(wèn)題信息匹配的至少一個(gè)知識(shí)片段,包括:
4.根據(jù)權(quán)利要求1或2所述的確定回答信息的方法,其特征在于,所述拒答檢測(cè)模型為以多個(gè)知識(shí)片段樣本以及所述知識(shí)片段樣本對(duì)應(yīng)的問(wèn)答樣本對(duì)中的問(wèn)題樣本為訓(xùn)練樣本,以所述問(wèn)答樣本對(duì)中的回答樣本為所述問(wèn)答樣本對(duì)中問(wèn)題樣本的標(biāo)簽,對(duì)第二智能問(wèn)答模型進(jìn)行訓(xùn)練得到的,所述第二智能問(wèn)答模型與第一智能問(wèn)答模型為相同類型的模型;
5.根...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張靖,
申請(qǐng)(專利權(quán))人:長(zhǎng)城汽車(chē)股份有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。