System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及知識(shí)圖譜,具體涉及一種基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法。
技術(shù)介紹
1、知識(shí)圖譜又稱為科學(xué)知識(shí)圖譜,在圖書(shū)情報(bào)界稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。
2、大語(yǔ)言模型(large?language?model,llm)是指使用大量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,可以生成自然語(yǔ)言文本或理解語(yǔ)言文本的含義。大語(yǔ)言模型可以處理多種自然語(yǔ)言任務(wù),如文本分類(lèi)、問(wèn)答、對(duì)話等,是通向人工智能的一條重要途徑。
3、現(xiàn)有的大語(yǔ)言模型無(wú)法與知識(shí)圖譜結(jié)合,進(jìn)而無(wú)法更好的應(yīng)用在圖書(shū)知識(shí)問(wèn)答場(chǎng)景中,亟需一種基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)實(shí)施例的目的在于提供一種基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,用以解決現(xiàn)有技術(shù)中大語(yǔ)言模型無(wú)法與知識(shí)圖譜結(jié)合,進(jìn)而無(wú)法更好的應(yīng)用在圖書(shū)知識(shí)問(wèn)答場(chǎng)景中的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本專利技術(shù)實(shí)施例提供一種基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,所述方法具體包括:
3、通過(guò)大語(yǔ)言模型提取知識(shí)并構(gòu)建知識(shí)圖譜;
4、獲取原始文檔,采用多種劃分方法對(duì)所述原始文檔進(jìn)行邏輯劃分得到片段,將所述片段輸入大語(yǔ)言模型進(jìn)行向量化,得到片段向量并存儲(chǔ)至向量庫(kù)中;
5、獲取用戶輸入問(wèn)題,基于所述知識(shí)圖譜進(jìn)行知識(shí)鏈接
6、將所述用戶輸入問(wèn)題輸入大語(yǔ)言模型進(jìn)行向量化,得到完整問(wèn)題向量;
7、將所述多個(gè)知識(shí)向量與完整問(wèn)題向量進(jìn)行拼接得到拼接向量;
8、將所述拼接向量與向量庫(kù)中所有片段向量進(jìn)行相似度計(jì)算,得到相似度得分,根據(jù)所述相似度得分取所有片段向量中預(yù)設(shè)數(shù)量的片段向量作為上下文;
9、基于所述上下文和用戶輸入問(wèn)題生成提示信息,將所述提示信息輸入大語(yǔ)言模型,生成問(wèn)題結(jié)果。
10、在上述技術(shù)方案的基礎(chǔ)上,本專利技術(shù)還可以做如下改進(jìn):
11、進(jìn)一步地,所述通過(guò)大語(yǔ)言模型提取知識(shí)并構(gòu)建知識(shí)圖譜,包括:
12、構(gòu)建圖書(shū)知識(shí)表示模型,用于給大語(yǔ)言模型提供待提取的知識(shí),所述圖書(shū)知識(shí)表示模型包括知識(shí)體系、圖書(shū)模型和領(lǐng)域業(yè)務(wù)模型;
13、基于所述大語(yǔ)言模型對(duì)圖書(shū)知識(shí)表示模型進(jìn)行提取,得到所述知識(shí)圖譜。
14、進(jìn)一步地,所述采用多種劃分方法對(duì)原始文檔進(jìn)行邏輯劃分得到片段包括:
15、采用固定窗口劃分、滑動(dòng)窗口劃分、按頁(yè)劃分、按段落劃分、按篇章節(jié)結(jié)構(gòu)劃分和其它邏輯劃分。
16、進(jìn)一步地,所述將多個(gè)知識(shí)向量與完整問(wèn)題向量進(jìn)行拼接得到拼接向量,包括:
17、將所述多個(gè)知識(shí)向量與完整問(wèn)題向量進(jìn)行加權(quán)拼接得到拼接向量。
18、進(jìn)一步地,所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法還包括:
19、在獲取所述用戶輸入問(wèn)題后,基于所述大語(yǔ)言模型對(duì)用戶輸入問(wèn)題進(jìn)行意圖分類(lèi),得到意圖分類(lèi)結(jié)果。
20、進(jìn)一步地,所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法還包括:
21、基于所述意圖分類(lèi)結(jié)果判斷用戶輸入問(wèn)題是否為復(fù)雜問(wèn)題,若是,基于所述大語(yǔ)言模型的內(nèi)聯(lián)架構(gòu)模式和外掛架構(gòu)模式生成問(wèn)題結(jié)果。
22、進(jìn)一步地,所述基于所述大語(yǔ)言模型的內(nèi)聯(lián)架構(gòu)模式和外掛架構(gòu)模式生成問(wèn)題結(jié)果,包括:
23、基于所述大語(yǔ)言模型的內(nèi)聯(lián)架構(gòu)模式生成問(wèn)題結(jié)果時(shí),使用所述知識(shí)圖譜中的知識(shí)直接增強(qiáng)所述大語(yǔ)言模型的推理能力。
24、進(jìn)一步地,所述基于所述大語(yǔ)言模型的內(nèi)聯(lián)架構(gòu)模式和外掛架構(gòu)模式生成問(wèn)題結(jié)果,還包括:
25、基于所述大語(yǔ)言模型的外掛架構(gòu)模式生成問(wèn)題結(jié)果時(shí),以所述大語(yǔ)言模型的增強(qiáng)推理能力為基礎(chǔ),以外掛方式接載所述知識(shí)圖譜推理引擎。
26、進(jìn)一步地,所述基于所述大語(yǔ)言模型的內(nèi)聯(lián)架構(gòu)模式和外掛架構(gòu)模式生成問(wèn)題結(jié)果,還包括:
27、在所述外掛架構(gòu)模式下,復(fù)雜任務(wù)的分解由所述大語(yǔ)言模型完成;
28、在執(zhí)行任務(wù)過(guò)程中,需要調(diào)用復(fù)雜推理計(jì)算時(shí),以其他方式調(diào)用知識(shí)圖譜的推理,其中,所述其他方式包括插件方式和接口方式。
29、進(jìn)一步地,所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法還包括:
30、基于零和/或小樣本學(xué)習(xí)方法對(duì)所述大語(yǔ)言模型進(jìn)行微調(diào)。
31、本專利技術(shù)中基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,包括:通過(guò)大語(yǔ)言模型提取知識(shí)并構(gòu)建知識(shí)圖譜;獲取原始文檔,采用多種劃分方法對(duì)所述原始文檔進(jìn)行邏輯劃分得到片段,將所述片段輸入大語(yǔ)言模型進(jìn)行向量化,得到片段向量并存儲(chǔ)至向量庫(kù)中;獲取用戶輸入問(wèn)題,基于所述知識(shí)圖譜進(jìn)行知識(shí)鏈接得到多個(gè)知識(shí),將所述多個(gè)知識(shí)逐個(gè)輸入大語(yǔ)言模型進(jìn)行向量化,得到知識(shí)向量;將所述用戶輸入問(wèn)題輸入大語(yǔ)言模型進(jìn)行向量化,得到完整問(wèn)題向量;將所述知識(shí)向量與完整問(wèn)題向量進(jìn)行拼接得到拼接向量;將所述拼接向量與向量庫(kù)中所有片段向量進(jìn)行相似度計(jì)算,得到相似度得分,取所述所有片段向量中相似度得分最高的片段向量作為上下文;基于所述上下文和用戶輸入問(wèn)題生成提示信息,將所述提示信息輸入大語(yǔ)言模型,生成問(wèn)題結(jié)果。解決了現(xiàn)有技術(shù)中大語(yǔ)言模型無(wú)法與知識(shí)圖譜結(jié)合,進(jìn)而無(wú)法更好的應(yīng)用在圖書(shū)知識(shí)問(wèn)答場(chǎng)景中的問(wèn)題。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述通過(guò)大語(yǔ)言模型提取知識(shí)并構(gòu)建知識(shí)圖譜,包括:
3.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述采用多種劃分方法對(duì)原始文檔進(jìn)行邏輯劃分得到片段包括:
4.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述將多個(gè)知識(shí)向量與完整問(wèn)題向量進(jìn)行拼接得到拼接向量,包括:
5.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法還包括:
6.根據(jù)權(quán)利要求5所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法還包括:
7.根據(jù)權(quán)利要求6所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述基于所述大語(yǔ)言模型的內(nèi)聯(lián)架構(gòu)模式和外掛架構(gòu)模式生成問(wèn)題結(jié)果,包括:
...【技術(shù)特征摘要】
1.基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述通過(guò)大語(yǔ)言模型提取知識(shí)并構(gòu)建知識(shí)圖譜,包括:
3.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述采用多種劃分方法對(duì)原始文檔進(jìn)行邏輯劃分得到片段包括:
4.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述將多個(gè)知識(shí)向量與完整問(wèn)題向量進(jìn)行拼接得到拼接向量,包括:
5.根據(jù)權(quán)利要求1所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法,其特征在于,所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的圖書(shū)知識(shí)問(wèn)答方法還包括:
6.根據(jù)權(quán)利要求5所述基于知識(shí)圖譜增強(qiáng)大語(yǔ)言模型的...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:胡芳槐,丁軍,
申請(qǐng)(專利權(quán))人:海乂知信息科技南京有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。