System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,具體涉及一種文本搜索方法、裝置、電子設備及存儲介質。
技術介紹
1、隨著科學技術發展,搜索引擎(例如elastic?search搜索引擎)為人們獲取信息提供了便利,用戶在搜索引擎中輸入相應的關鍵詞進行搜索,搜索引擎使用高亮功能進行搜索查詢,返回搜索結果并以高亮片段形式展示。
2、然而,直接使用搜索引擎高亮功能給出的搜索結果有時并不符合用戶實際需求,因此搜索結果準確度不高。
技術實現思路
1、本申請的目的是針對上述現有技術的不足提出的一種文本搜索方法、裝置、電子設備及存儲介質,該目的是通過以下技術方案實現的。
2、本申請的第一方面提出了一種文本搜索方法,所述方法包括:
3、在搜索文本中獲取與搜索語句匹配的至少一個候選片段;
4、針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征;所述特征反映了候選片段與搜索語句的匹配特點;
5、基于每個候選片段在每個評估維度上對應的特征,確定每個候選片段的評估分;
6、根據所述評估分在所述至少一個候選片段中選取所述搜索語句的搜索結果。
7、在本申請的一些實施例中,所述針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征,包括:
8、針對每個候選片段,提取所述候選片段包含的文本內容;獲取所述搜索語句包含的核心詞和短語詞;基于所述核心詞、所述短語詞和所述文本內容進行不同維度評估,獲得所述候選片
9、在本申請的一些實施例中,所述候選片段具有的特征:文本內容包含搜索語句、文本內容包含核心詞、文本內容包含短語詞、片段長度位于預設字符數范圍之內、索引標記位置在片段的前預設數量字符之內中的任一個或多個,所述索引標記位置為搜索語句或短語詞或核心詞在片段中的位置。
10、在本申請的一些實施例中,所述提取所述候選片段包含的文本內容,包括:
11、去掉所述候選片段中的非文本內容,以得到所述候選片段的文本內容;其中,所述非文本內容包含換行符、空格符和表情符號。
12、在本申請的一些實施例中,所述基于每個候選片段在每個評估維度上對應的特征,確定每個候選片段的評估分,包括:
13、針對每個候選片段,獲取所述候選片段在每個評估維度上對應的特征的預設等級;根據獲取的預設等級確定所述候選片段的評估分。
14、在本申請的一些實施例中,在針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征之前,所述方法還包括:
15、顯示文本片段評估設置界面;響應于所述文本片段評估設置界面的配置操作,獲取配置的評估維度信息。
16、在本申請的一些實施例中,所述在搜索文本中獲取與搜索語句匹配的至少一個候選片段,包括:
17、獲取所述搜索語句包含的核心詞和短語詞;通過調用預設搜索引擎基于所述搜索語句、所述核心詞和所述短語詞在所述搜索文本中搜索匹配片段,并將搜索到的匹配片段作為候選片段。
18、本申請的第二方面提出了一種文本搜索裝置,所述裝置包括:
19、片段獲取模塊,用于在搜索文本中獲取與搜索語句匹配的至少一個候選片段;
20、片段評估模塊,用于針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征,并基于每個候選片段在每個評估維度上對應的特征,確定每個候選片段的評估分;
21、結果確定模塊,用于根據所述評估分在所述至少一個候選片段中選取所述搜索語句的搜索結果。
22、本申請的第三方面提出了一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序以實現如上述第一方面所述方法的步驟。
23、本申請的第四方面提出了一種計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執行以實現如上述第一方面所述方法的步驟。
24、基于上述第一方面和第二方面所述的文本搜索方法及裝置,本申請至少具有如下有益效果或優點:
25、通過獲取搜索語句匹配到的多個候選片段,并通過對每個候選片段進行不同維度評估,以獲得每個候選片段在每個評估維度上對應的特征,從而基于各個候選片段具有的不同特征對候選片段進行評分,由于評估獲得的特征可以反映候選片段與搜索語句的匹配特點,因此基于特征得到的候選片段的評估分可以反映搜索結果與搜索語句的匹配度,因此根據評估分進一步選擇的搜索結果更加精確,并且能夠更好地滿足用戶的實際需求。
26、上述說明僅是本申請技術方案的概述,為了能夠更清楚了解本申請的技術手段,可依照說明書的內容予以實施,并且為了讓本申請的上述和其他目的、特征和優點能夠更明顯易懂,以下特舉本申請的具體實施方式。
本文檔來自技高網...【技術保護點】
1.一種文本搜索方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征,包括:
3.根據權利要求1或2任一項所述的方法,其特征在于,所述候選片段在每個評估維度上對應的特征:文本內容包含完整的搜索語句、文本內容包含核心詞、文本內容包含短語詞、片段長度位于預設字符數范圍之內、索引標記位置在片段的前預設數量字符之內中的任一個或多個,所述索引標記位置為搜索語句或短語詞或核心詞在片段中的位置。
4.根據權利要求2所述的方法,其特征在于,所述提取所述候選片段包含的文本內容,包括:
5.根據權利要求1所述的方法,其特征在于,所述基于每個候選片段在每個評估維度上對應的特征,確定每個候選片段的評估分,包括:
6.根據權利要求1-5任一項所述的方法,其特征在于,在針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征之前,所述方法還包括:
7.根據權利要求1所述的方法,其特征在于,所述在搜索文本中獲取與搜索
8.一種文本搜索裝置,其特征在于,所述裝置包括:
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序以實現如權利要求1-7任一項所述方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行以實現如權利要求1-7任一項所述方法的步驟。
...【技術特征摘要】
1.一種文本搜索方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述針對每個候選片段進行不同維度評估,得到每個候選片段在每個評估維度上對應的特征,包括:
3.根據權利要求1或2任一項所述的方法,其特征在于,所述候選片段在每個評估維度上對應的特征:文本內容包含完整的搜索語句、文本內容包含核心詞、文本內容包含短語詞、片段長度位于預設字符數范圍之內、索引標記位置在片段的前預設數量字符之內中的任一個或多個,所述索引標記位置為搜索語句或短語詞或核心詞在片段中的位置。
4.根據權利要求2所述的方法,其特征在于,所述提取所述候選片段包含的文本內容,包括:
5.根據權利要求1所述的方法,其特征在于,所述基于每個候選片段在每個評估維度上對...
【專利技術屬性】
技術研發人員:曹亞軍,
申請(專利權)人:北京新氧科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。