System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及文獻(xiàn)檢索,尤其是涉及到一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索方法、裝置、存儲介質(zhì)及計(jì)算機(jī)設(shè)備。
技術(shù)介紹
1、傳統(tǒng)學(xué)術(shù)文獻(xiàn)檢索方法主要依賴于標(biāo)引或編目信息,這種方式局限于對預(yù)設(shè)字段的搜索,難以深入文獻(xiàn)的核心內(nèi)容。盡管信息技術(shù)有所進(jìn)步,但傳統(tǒng)檢索手段在處理上仍顯捉襟見肘,它們往往止步于文獻(xiàn)的基本屬性信息,而難以觸及文獻(xiàn)內(nèi)容的精髓。更為不足的是,傳統(tǒng)方法在自然語言語義檢索方面的支持相當(dāng)薄弱,這無疑加大了對檢索人員專業(yè)技能的要求,使得文獻(xiàn)檢索過程更為復(fù)雜和繁瑣。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請實(shí)施例提供了一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索方法、裝置、存儲介質(zhì)及計(jì)算機(jī)設(shè)備,有助于降低文獻(xiàn)檢索門檻、提升文獻(xiàn)檢索效率。
2、根據(jù)本申請的一個(gè)方面,提供了一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索方法,所述方法包括:
3、獲取學(xué)術(shù)文獻(xiàn)檢索信息,其中,所述學(xué)術(shù)文獻(xiàn)檢索信息為自然語言文本;
4、通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式,其中,所述檢索場景大模型為基于微調(diào)指令集進(jìn)行指令微調(diào)的大模型,所述微調(diào)指令集包括多條微調(diào)指令,每條微調(diào)指令包括學(xué)術(shù)文獻(xiàn)檢索信息樣本和對應(yīng)的檢索式樣本;
5、對所述目標(biāo)檢索式進(jìn)行可視化顯示,并響應(yīng)于對所述目標(biāo)檢索式的確認(rèn)指令,基于所述目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索。
6、可選地,所述獲取學(xué)術(shù)文獻(xiàn)檢索信息,包括:
7、獲取以文本形式輸入的學(xué)術(shù)文獻(xiàn)檢索信息;和/或,
8、獲取以語音形式輸入的學(xué)術(shù)
9、可選地,所述通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式,包括:
10、基于所述學(xué)術(shù)文獻(xiàn)檢索信息構(gòu)建第一提示詞,將所述第一提示詞輸入至所述檢索場景大模型中,以通過所述檢索場景大模型基于所述第一提示詞進(jìn)行檢索意圖識別,輸出檢索要素信息;
11、基于所述檢索要素信息構(gòu)建與預(yù)設(shè)檢索項(xiàng)匹配的目標(biāo)檢索單元,并基于所述目標(biāo)檢索單元生成所述目標(biāo)檢索式。
12、可選地,所述基于所述學(xué)術(shù)文獻(xiàn)檢索信息構(gòu)建第一提示詞,包括:
13、基于所述學(xué)術(shù)文獻(xiàn)檢索信息和預(yù)設(shè)檢索意圖識別模板,構(gòu)建所述第一提示詞,其中,所述預(yù)設(shè)檢索意圖識別模板用于引導(dǎo)所述檢索場景大模型在第一提示詞中的學(xué)術(shù)文獻(xiàn)檢索信息中識別出與所述預(yù)設(shè)檢索項(xiàng)匹配的檢索要素,并在無法識別出檢索要素的情況下對所述學(xué)術(shù)文獻(xiàn)檢索信息進(jìn)行語義理解;
14、相應(yīng)地,所述基于所述檢索要素信息構(gòu)建與預(yù)設(shè)檢索項(xiàng)匹配的目標(biāo)檢索單元,包括:
15、若所述檢索要素信息為與預(yù)設(shè)檢索項(xiàng)對應(yīng)的檢索要素,則基于所述檢索要素信息中與預(yù)設(shè)檢索項(xiàng)匹配的檢索要素,構(gòu)建與預(yù)設(shè)檢索項(xiàng)對應(yīng)的目標(biāo)檢索單元;
16、若所述檢索要素信息為所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的語義信息,則基于所述語義信息,構(gòu)建以主題為檢索項(xiàng)的目標(biāo)檢索單元;
17、其中,所述預(yù)設(shè)檢索項(xiàng)至少包括標(biāo)題、主題、發(fā)表年、作者、作者單位。
18、可選地,所述通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式之前,所述方法還包括:
19、基于學(xué)術(shù)文獻(xiàn)標(biāo)注項(xiàng)和著錄項(xiàng),構(gòu)建文獻(xiàn)檢索數(shù)據(jù)項(xiàng)框架,其中,所述文獻(xiàn)檢索數(shù)據(jù)項(xiàng)框架包括多個(gè)檢索單元,每個(gè)檢索單元包括預(yù)設(shè)檢索項(xiàng)、預(yù)設(shè)檢索邏輯、預(yù)設(shè)檢索項(xiàng)值規(guī)則;
20、獲取多條歷史檢索日志,基于所述文獻(xiàn)檢索數(shù)據(jù)項(xiàng)框架將各歷史檢索日志分解為與所述檢索單元中的預(yù)設(shè)檢索項(xiàng)、預(yù)設(shè)檢索邏輯、預(yù)設(shè)檢索項(xiàng)值規(guī)則匹配的檢索要素樣本,并生成各歷史檢索日志對應(yīng)的學(xué)術(shù)文獻(xiàn)檢索信息樣本;
21、將所述檢索要素樣本作為檢索式樣本,基于各歷史檢索日志對應(yīng)的所述學(xué)術(shù)文獻(xiàn)檢索信息樣本和所述檢索式樣本構(gòu)建各歷史檢索日志對應(yīng)的微調(diào)指令,并生成包括多個(gè)微調(diào)指令的微調(diào)指令集;
22、基于所述微調(diào)指令集對大模型進(jìn)行指令微調(diào),以獲得所述檢索場景大模型。
23、可選地,所述對所述目標(biāo)檢索式進(jìn)行可視化顯示,包括:
24、基于所述目標(biāo)檢索式,填充檢索頁面中的各檢索單元區(qū)域和檢索式區(qū)域,所述檢索單元區(qū)域包括檢索項(xiàng)、以及檢索項(xiàng)對應(yīng)的檢索邏輯和檢索項(xiàng)值;
25、顯示填充后的檢索頁面。
26、可選地,所述響應(yīng)于對所述目標(biāo)檢索式的確認(rèn)指令,基于所述目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索,包括:
27、響應(yīng)于對檢索頁面的確認(rèn)指令,基于所述目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索;或者,
28、接收對所述檢索頁面的修改操作,修改檢索單元區(qū)域和檢索式區(qū)域的填充內(nèi)容,并響應(yīng)于對修改后的檢索頁面的確認(rèn)指令,基于所述修改后的目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索;或者,
29、響應(yīng)于對所述檢索頁面中的檢索信息錄入控件的觸發(fā)操作,獲取補(bǔ)錄的學(xué)術(shù)文獻(xiàn)檢索信息,并基于所述學(xué)術(shù)文獻(xiàn)檢索信息和所述補(bǔ)錄的學(xué)術(shù)文獻(xiàn)檢索系信息構(gòu)建第二提示詞,將所述第二提示詞輸入至所述檢索場景大模型中,以獲得更正后的目標(biāo)檢索式,對所述更正后的目標(biāo)檢索式填充所述檢索頁面,響應(yīng)于對檢索頁面或經(jīng)過修改的檢索頁面的確認(rèn)指令,基于被確認(rèn)的目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索。
30、根據(jù)本申請的另一方面,提供了一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索裝置,所述裝置包括:
31、檢索信息獲取模塊,用于獲取學(xué)術(shù)文獻(xiàn)檢索信息,其中,所述學(xué)術(shù)文獻(xiàn)檢索信息為自然語言文本;
32、檢索式生成模塊,用于通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式,其中,所述檢索場景大模型為基于微調(diào)指令集進(jìn)行指令微調(diào)的大模型,所述微調(diào)指令集包括多條微調(diào)指令,每條微調(diào)指令包括學(xué)術(shù)文獻(xiàn)檢索信息樣本和對應(yīng)的檢索式樣本;
33、文獻(xiàn)檢索模塊,用于對所述目標(biāo)檢索式進(jìn)行可視化顯示,并響應(yīng)于對所述目標(biāo)檢索式的確認(rèn)指令,基于所述目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索。
34、可選地,所述檢索信息獲取模塊,還用于:
35、獲取以文本形式輸入的學(xué)術(shù)文獻(xiàn)檢索信息;和/或,
36、獲取以語音形式輸入的學(xué)術(shù)文獻(xiàn)檢索音頻,并對所述學(xué)術(shù)文獻(xiàn)檢索音頻進(jìn)行語音識別,獲得文本形式的學(xué)術(shù)文獻(xiàn)檢索信息。
37、可選地,所述檢索式生成模塊,還用于:
38、基于所述學(xué)術(shù)文獻(xiàn)檢索信息構(gòu)建第一提示詞,將所述第一提示詞輸入至所述檢索場景大模型中,以通過所述檢索場景大模型基于所述第一提示詞進(jìn)行檢索意圖識別,輸出檢索要素信息;
39、基于所述檢索要素信息構(gòu)建與預(yù)設(shè)檢索項(xiàng)匹配的目標(biāo)檢索單元,并基于所述目標(biāo)檢索單元生成所述目標(biāo)檢索式。
40、可選地,所述檢索式生成模塊,還用于:
41、基于所述學(xué)術(shù)文獻(xiàn)檢索信息和預(yù)設(shè)檢索意圖識別模板,構(gòu)建所述第一提示詞,其中,所述預(yù)設(shè)檢索意圖識別模板用于引導(dǎo)所述檢索場景大模型在第一提示詞中的學(xué)術(shù)文獻(xiàn)檢索信息中識別出與所述預(yù)設(shè)檢索項(xiàng)匹配的檢索要素,并在無法識別出檢索要素的情況下對所述學(xué)術(shù)文獻(xiàn)檢索信本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取學(xué)術(shù)文獻(xiàn)檢索信息,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述學(xué)術(shù)文獻(xiàn)檢索信息構(gòu)建第一提示詞,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式之前,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述目標(biāo)檢索式進(jìn)行可視化顯示,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述響應(yīng)于對所述目標(biāo)檢索式的確認(rèn)指令,基于所述目標(biāo)檢索式進(jìn)行學(xué)術(shù)文獻(xiàn)檢索,包括:
8.一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索裝置,其特征在于,所述裝置包括:
9.一種存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法。
10.一種計(jì)
...【技術(shù)特征摘要】
1.一種基于大模型的學(xué)術(shù)文獻(xiàn)檢索方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取學(xué)術(shù)文獻(xiàn)檢索信息,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述學(xué)術(shù)文獻(xiàn)檢索信息構(gòu)建第一提示詞,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過檢索場景大模型生成所述學(xué)術(shù)文獻(xiàn)檢索信息對應(yīng)的目標(biāo)檢索式之前,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:薛德軍,張慶國,劉艷,耿崇,師慶輝,
申請(專利權(quán))人:同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。