System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及信息處理,特別涉及一種文獻檢索方法、裝置、介質及設備。
技術介紹
1、在現有的文獻檢索方法中,通常是基于關鍵詞的檢索方式來檢索出相應的文獻數據。但是這種檢索方式存在召回路徑單一的問題,無法滿足用戶多樣的檢索需求。
2、由此,亟需一種文獻檢索方法,以解決現有技術中檢索模式單一,無法支持多種檢索模式,無法滿足用戶多樣的檢索需求的問題。
技術實現思路
1、有鑒于此,本專利技術提供了一種文獻檢索方法、裝置、介質及設備,主要目的在于解決目前存在的檢索模式單一,無法支持多種檢索模式,無法滿足用戶多樣的檢索需求的問題。
2、為解決上述問題,本申請提供一種文獻檢索方法,包括:
3、基于檢索信息的目標配置方式,確定與所述目標配置方式對應的目標檢索策略,其中,檢索策略包括:條件檢索策略和語句檢索策略;
4、在所述目標檢索策略為條件檢索策略時,基于所述檢索信息中的目標檢索條件,從目標數據庫中檢索獲得符合所述目標檢索條件的若干目標文獻;
5、在所述目標檢索策略為語句檢索策略時,基于檢索信息中的目標檢索語句,確定查詢語言檢索方式或向量相似性檢索方式為目標檢索方式,以基于所述目標檢索語句利用所述目標檢索方式、從目標數據庫中檢索獲得與所述目標檢索語句匹配的若干目標文獻或若干目標知識片段。
6、可選的,所述配置方式包括檢索條件選中的第一配置方式以及檢索語句輸入的第二配置方式;
7、所述基于檢索信息的配置方式,確定與所
8、基于檢索信息的第一配置方式,確定條件檢索策略為目標檢索策略;
9、或者,基于檢索信息的第二配置方式,確定語句檢索策略為目標檢索策略。
10、可選的,所述目標檢索條件包括如下任意一種或幾種:主題條件、機構條件、研究層次條件、姓名條件;
11、所述基于所述檢索信息中的目標檢索條件,從目標數據庫中檢索獲得符合所述目標檢索條件的若干目標文獻,具體包括:
12、基于所述檢索信息中的主題條件、機構條件、研究層次條件以及姓名條件中任意一種或幾種檢索條件,構建查詢語言;
13、基于所述查詢語言對所述目標數據庫中的文獻進行篩選,獲得所述若干目標文獻。
14、可選的,所述基于檢索信息中的目標檢索語句,確定查詢語言檢索方式或向量相似性檢索方式為目標檢索方式,具體包括:
15、對目標檢索語句進行檢索意圖識別,獲得條件型檢索意圖或非條件型檢索意圖;
16、在獲得條件型檢索意圖時,確定查詢語言檢索方式為目標檢索方式;
17、在獲得非條件型檢索意圖時,確定向量相似性檢索方式為目標檢索方式。
18、可選的,在所述目標檢索方式為查詢語言檢索方式時,所述基于所述目標檢索語句利用所述目標檢索方式、從目標數據庫中檢索獲得與所述目標檢索語句匹配的若干目標文獻或若干目標知識片段,具體包括:
19、基于所述目標檢索語句中的關鍵詞,確定目標檢索條件,以基于所述目標檢索條件對目標數據庫中的文獻進行篩選,獲得所述若干目標文獻;
20、在所述目標檢索方式為向量相似性檢索方式時,所述基于所述目標檢索語句利用所述目標檢索方式、從目標數據庫中檢索獲得與所述目標檢索語句匹配的若干目標文獻或若干目標知識片段,具體包括:
21、基于所述目標檢索語句確定目標語句向量,以基于所述目標語句向量對目標數據庫中的文獻進行篩選,獲得包含所述目標語句向量的目標文獻或與所述目標語句向量匹配的目標知識片段。
22、可選的,所述基于所述目標檢索語句確定目標語句向量,以基于所述目標語句向量對目標數據庫中的文獻進行篩選,獲得包含所述目標語句向量的目標文獻或與所述目標語句向量匹配的目標知識片段,具體包括:
23、基于所述目標檢索語句中的關鍵片段,確定所述目標語句向量;
24、基于所述目標語句向量以及目標檢索層級,從目標數據庫所對應的目標向量庫中,確定向量相似度符合預定相似度條件、且符合所述目標檢索層級的各目標文獻片段向量;
25、基于各所述目標文獻片段向量以及各文獻片段向量與文獻片段的對應關系,確定各目標文獻片段向量對應的目標文獻片段,以基于各所述目標文獻片段確定所述若干目標知識片段或若干目標文獻。
26、可選的,在獲得若干目標文獻或者若干目標知識片段之后,所述方法還包括:
27、對各目標文獻以及目標知識片段進行排序,獲得排序后的目標文獻列表以及目標知識片段列表;
28、對所述目標文獻列表以及目標知識片段列表進行顯示。
29、為解決上述問題,本申請提供一種文獻檢索裝置,包括:
30、確定模塊,用于基于檢索信息的配置方式,確定與所述配置方式對應的目標檢索策略,其中,檢索策略包括:條件檢索策略和語句檢索策略;
31、檢索模塊,用于在所述目標檢索策略為條件檢索策略時,基于所述檢索信息中的目標檢索條件,從目標數據庫中檢索獲得符合所述目標檢索條件的若干目標文獻;
32、所述檢索模塊,還用于在所述目標檢索策略為語句檢索策略時,基于檢索信息中的目標檢索語句,確定查詢語言檢索方式或向量相似性檢索方式為目標檢索方式,以基于所述目標檢索語句利用所述目標檢索方式、從目標數據庫中檢索獲得與所述目標檢索語句匹配的若干目標文獻或若干目標知識片段。
33、為解決上述問題,本申請提供一種存儲介質,所述存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述任一項所述文獻檢索方法的步驟。
34、為解決上述問題,本申請提供一種電子設備,至少包括存儲器、處理器,所述存儲器上存儲有計算機程序,所述處理器在執行所述存儲器上的計算機程序時實現上述任一項所述文獻檢索方法的步驟。
35、本申請中的文獻檢索方法、裝置、介質及設備,通過獲取檢索信息的配置方式,能夠根據配置方式精準的確定條件檢索策略或語句檢索策略為目標檢索策略,實現了多種檢索模式/檢索策略的精準選擇,并且,在確定目標檢測策略為語句檢索策略時,可以進一步根據檢索信息中目標檢索語句的語句向量/片段向量,從目標數據庫中準確、快速的匹配獲得與該語句向量/片段向量對應的目標知識片段或目標文獻,實現了針對知識片段的精準檢索,解決了現有技術中檢索方式/檢索模式單一,無法滿足用戶多樣的檢索需求的問題。實現了支持文獻內容長短句、段落、詞組、詞元、實體、知識圖譜等不同粒度及類型的知識片段檢索的問題,擴充了檢索路徑/檢索模式,提升檢索結果召回程度,提升知網知識資源的利用效率。
36、上述說明僅是本專利技術技術方案的概述,為了能夠更清楚了解本專利技術的技術手段,而可依照說明書的內容予以實施,并且為了讓本專利技術的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本專利技術的具體實施方式。
本文檔來自技高網...【技術保護點】
1.一種文獻檢索方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,所述配置方式包括檢索條件選中的第一配置方式以及檢索語句輸入的第二配置方式;
3.如權利要求1所述的方法,其特征在于,所述目標檢索條件包括如下任意一種或幾種:主題條件、機構條件、研究層次條件、姓名條件;
4.如權利要求1所述的方法,其特征在于,所述基于檢索信息中的目標檢索語句,確定查詢語言檢索方式或向量相似性檢索方式為目標檢索方式,具體包括:
5.如權利要求1所述的方法,其特征在于,在所述目標檢索方式為查詢語言檢索方式時,所述基于所述目標檢索語句利用所述目標檢索方式、從目標數據庫中檢索獲得與所述目標檢索語句匹配的若干目標文獻或若干目標知識片段,具體包括:
6.如權利要求5所述的方法,其特征在于,所述基于所述目標檢索語句確定目標語句向量,以基于所述目標語句向量對目標數據庫中的文獻進行篩選,獲得包含所述目標語句向量的目標文獻或與所述目標語句向量匹配的目標知識片段,具體包括:
7.如權利要求1-6任意一項所述的方法,其特征在于,在獲得若
8.一種文獻檢索裝置,其特征在于,包括:
9.一種存儲介質,其特征在于,所述存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述權利要求1-7任一項所述文獻檢索方法的步驟。
10.一種電子設備,其特征在于,至少包括存儲器、處理器,所述存儲器上存儲有計算機程序,所述處理器在執行所述存儲器上的計算機程序時實現上述權利要求1-7任一項所述文獻檢索方法的步驟。
...【技術特征摘要】
1.一種文獻檢索方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,所述配置方式包括檢索條件選中的第一配置方式以及檢索語句輸入的第二配置方式;
3.如權利要求1所述的方法,其特征在于,所述目標檢索條件包括如下任意一種或幾種:主題條件、機構條件、研究層次條件、姓名條件;
4.如權利要求1所述的方法,其特征在于,所述基于檢索信息中的目標檢索語句,確定查詢語言檢索方式或向量相似性檢索方式為目標檢索方式,具體包括:
5.如權利要求1所述的方法,其特征在于,在所述目標檢索方式為查詢語言檢索方式時,所述基于所述目標檢索語句利用所述目標檢索方式、從目標數據庫中檢索獲得與所述目標檢索語句匹配的若干目標文獻或若干目標知識片段,具體包括:
6.如權利要求5所述的...
【專利技術屬性】
技術研發人員:薛德軍,張超,張慶國,師慶輝,耿崇,武文成,時曉利,任天贈,賈新宇,馮自強,王國紅,
申請(專利權)人:同方知網數字出版技術股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。