System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及數據檢索,具體涉及檢索數據的確定方法、裝置、設備、存儲介質及程序產品。
技術介紹
1、隨著計算機技術的發展,各種自動檢索方式應運而生,展現出了強大的數據檢索能力。目前,信息檢索和召回往往依賴復雜的人工調參,但其存在有效信息損失的風險。另外,對于多義性問題,難以充分利用上下文信息來理解用戶的真實意圖,從而可能導致檢索結果的準確性不足,冗余度較高。
技術實現思路
1、有鑒于此,本公開提供了一種檢索數據的確定方法、裝置、設備、存儲介質及程序產品,以解決檢索結果準確性不足的問題。
2、第一方面,本公開提供了一種檢索數據的確定方法,包括:獲取檢索問題,確定與檢索問題相關的粗召字段集;基于檢索問題的上下文信息,對檢索問題進行命名實體識別,得到檢索問題對應的多個實體片段;將各個實體片段與粗召字段集中的字段進行關聯,確定各個實體片段對應的關聯字段;基于關聯字段的數量對實體片段的相關字段進行召回,得到檢索問題對應的目標關聯字段;按照目標關聯字段針對檢索問題進行數據檢索,生成檢索結果。
3、第二方面,本公開提供了一種檢索數據的確定裝置,包括:獲取模塊,用于獲取檢索問題,確定與檢索問題相關的粗召字段集;實體識別模塊,用于基于檢索問題的上下文信息,對檢索問題進行命名實體識別,得到檢索問題對應的多個實體片段;關聯模塊,用于將各個實體片段與粗召字段集中的字段進行關聯,確定各個實體片段對應的關聯字段;召回模塊,用于基于關聯字段的數量對實體片段的相關字段進行召回,得到檢索問題對應
4、第三方面,本公開提供了一種計算機設備,包括:存儲器和處理器,存儲器和處理器之間互相通信連接,存儲器中存儲有計算機指令,處理器通過執行計算機指令,從而執行上述第一方面或其對應的任一實施方式的檢索數據的確定方法。
5、第四方面,本公開提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機指令,計算機指令用于使計算機執行上述第一方面或其對應的任一實施方式的檢索數據的確定方法。
6、第五方面,本公開提供了一種計算機程序產品,包括計算機指令,計算機指令用于使計算機執行上述第一方面或其對應的任一實施方式的檢索數據的確定方法。
7、本公開提供的檢索數據的確定方法、裝置、設備、存儲介質及程序產品,利用檢索問題作為整體進行初步字段粗召,提升了粗召準確率;結合檢索問題的上下文信息對檢索問題進行命名實體識別,從而能夠結合上下文信息充分理解用戶的真實意圖,以根據用戶的真實意圖進行實體片段切分的動態調整,便于對檢索問題進行精細化處理,保證實體片段的識別準確度,提升了實體片段與數據庫字段匹配的準確度。將各個實體片段與粗召字段集中的字段進行關聯,利用實體片段所對應的關聯字段的數量確定檢索問題對應的目標關聯字段,保證目標關聯字段能夠準確貼合實體片段,減少目標關聯字段的冗余。利用目標關聯字段進行數據檢索,提升了數據檢索效率,保證了檢索結果的準確性。
本文檔來自技高網...【技術保護點】
1.一種檢索數據的確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,基于所述關聯字段的數量對所述實體片段的相關字段進行召回,得到所述檢索問題對應的目標關聯字段,包括:
3.根據權利要求2所述的方法,其特征在于,基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,包括:
4.根據權利要求3所述的方法,其特征在于,所述基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,還包括:
5.根據權利要求3所述的方法,其特征在于,所述基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,還包括:
6.根據權利要求5所述的方法,其特征在于,所述基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,還包括:
7.根據權利要求1所述的方法,其特征在于,所述按照所述目標關聯字段
8.根據權利要求1所述的方法,其特征在于,所述獲取檢索問題,確定與所述檢索問題相關的粗召字段集,包括:
9.一種檢索數據的確定裝置,其特征在于,所述裝置包括:
10.一種計算機設備,其特征在于,包括:
11.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機指令,所述計算機指令用于使計算機執行權利要求1至8中任一項所述的檢索數據的確定方法。
12.一種計算機程序產品,其特征在于,包括計算機指令,所述計算機指令用于使計算機執行權利要求1至8中任一項所述的檢索數據的確定方法。
...【技術特征摘要】
1.一種檢索數據的確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,基于所述關聯字段的數量對所述實體片段的相關字段進行召回,得到所述檢索問題對應的目標關聯字段,包括:
3.根據權利要求2所述的方法,其特征在于,基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,包括:
4.根據權利要求3所述的方法,其特征在于,所述基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,還包括:
5.根據權利要求3所述的方法,其特征在于,所述基于所述實體片段對應的所述關聯字段的數量,對所述實體片段進行相關字段召回,得到所述實體片段對應的候選關聯字段,還包括:
6.根據權利要求5所述的方法,其特征在于,所述基于所...
【專利技術屬性】
技術研發人員:何冠霄,高陽,肖波,李浩哲,趙曉明,
申請(專利權)人:北京火山引擎科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。