【技術實現步驟摘要】
本公開涉及信息檢索技術,尤其涉及一種參考文檔的推薦方法及裝置。
技術介紹
隨著社會的快速發展,科學技術的不斷進步,人們所能觸及到的信息呈現幾何式的增長,人們越來越需要借助信息搜索技術在海量的信息中挖掘出有效信息。目前,用戶在用office等辦公軟件,如word寫論文、報告等文章前,通常需要進行參考文獻的檢索,檢索過程一般是根據文章的主體思想,設定幾個關鍵詞語,并利用百度搜索、谷歌搜索等搜索引擎進行關鍵詞語的檢索,然后在搜索到的信息中查找是否有自己需要的有用信息。檢索的效果好壞很大程度上取決于用戶對檢索技巧掌握,如關鍵詞選擇是否合適,從搜索到的海量信息中快速定位有價值信息的個人能力等種種因素。公開內容為克服相關技術中存在的問題,本公開提供一種參考文檔的推薦方法及裝置,所述技術方案如下:根據本公開實施例的第一方面,提供一種參考文檔的推薦方法,包括:獲取用戶正在操作的目標文檔的內容信息;根據預設解析規則,對所述內容信息進行解析;對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;將所述參考文檔進行顯示。可選的,所述預設解析規則包括:標志內容提取規則、分詞規則;所述根據預設解析規則,對所述內容信息進行解析,包括:根據所述標志內容提取規則,提取所述內容信息中的標志內容;所述標志內容包括以下至少一項:所述目標文檔中指明的關鍵詞、所述 ...
【技術保護點】
一種參考文檔的推薦方法,其特征在于,包括:獲取用戶正在操作的目標文檔的內容信息;根據預設解析規則,對所述內容信息進行解析;對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;將所述參考文檔進行顯示。
【技術特征摘要】
1.一種參考文檔的推薦方法,其特征在于,包括:
獲取用戶正在操作的目標文檔的內容信息;
根據預設解析規則,對所述內容信息進行解析;
對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;
基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;
將所述參考文檔進行顯示。
2.根據權利要求1所述的方法,其特征在于,所述預設解析規則包括:標志內容提
取規則、分詞規則;所述根據預設解析規則,對所述內容信息進行解析,包括:
根據所述標志內容提取規則,提取所述內容信息中的標志內容;所述標志內容包括以
下至少一項:所述目標文檔中指明的關鍵詞、所述目標文檔標題;
根據所述分詞規則對提取所述標志內容后的內容信息進行分詞處理,得到分詞處理后
的各個詞語片斷。
3.根據權利要求2所述的方法,其特征在于,所述關鍵信息包括:所述標志內容、
所述詞語片斷;相應的,所述對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息
中提取出檢索詞包括:
將各個所述詞語片斷中的不相關詞語刪除;所述不相關詞語包括以下一種或多種:連
接詞語、單字詞語、稱謂詞語;
對刪除處理后剩余的各個詞語片斷進行重復出現頻度排序;
根據頻度由大到小的順序,從排序第一位的詞語片斷開始選出滿足預設閾值個數的詞
語片斷,并在所述選出的詞語片斷中去除與所述標志內容一致的詞語片斷,得到篩選后的
詞語片斷;所述篩選后的詞語片斷與所述標志內容構成所述檢索詞。
4.根據權利要求1所述的方法,其特征在于,所述基于所述檢索詞進行檢索,得到
包含所述檢索詞的參考文檔,包括:
將所述檢索詞導入搜索庫中進行檢索,得到包含所述檢索詞的參考文檔;所述搜索庫
包含以下一種或多種:本地存儲介質、用戶預設的云存儲設備、公共搜索引擎資源。
5.根據權利要求1所述的方法,其特征在于,還包括:所述基于所述檢索詞進行檢
索之后,
根據預設評價規則,對檢索得到的文檔進行評價處理;所述評價規則包括以下一種或
\t多種:被引用次數因子、文檔好評率、文檔質量程度。
相應的,所述得到包含檢索詞的參考文檔包括:
根據所述評價處理結果對檢索得到的所述參考文檔進行優先級排序,以使所述參考文
檔具有優先級順序。
6.根據權利要求1所述的方法,其特征在于,還包括:所述對解析后得到的關鍵信
息進行篩選處理,以從所述關鍵信息中提取出檢索詞之后,
根據所述檢索詞在所述目標文檔中所處位置與用戶當前輸入字符位置之間的距離,或
者根據所述檢索詞在所述目標文檔中的權重值,對所述檢索詞進行優先級排序;
相應的,所述基于所述檢索詞進行檢索,包括:
基于排序得到的所述檢索詞的優先級順序進行檢索。
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
對所述目標文檔進行語義理解分析,獲取所述目標文檔的主題屬性;
相應的,所述得到與所述目標文檔相似的參考文檔之后,還包括:
根據所述主題屬性對所述參考文檔進行排序,將與所述主題屬性匹配度高的參考文檔
進行優先顯示。
8.根據權利要求1所述的方法,其特征在于,所述將所述參考文檔進行顯示包括:
所述參考文檔與所述目標文檔位于同一顯示窗口內顯示,或者所述參考文檔與所述目
標文檔位于不同顯示窗口內顯示。
9.根據權利要求8所述的方法,其特征在于,所述參考文檔與所述目標文檔位于同
一顯示窗口內包括:
所述參考文檔與所述目標文檔分欄顯示,所述參考文檔位于所述顯示窗口的任意一
側;或者,所述參考文檔以浮窗形式覆蓋顯示于所述目標文檔表面。
10.一種參考文檔的推薦裝置,其特征在于,包括:
獲取模塊,用于獲取用戶正在操作的目標文檔的內容信息;
解析模塊,用于根據預設解析規則,對所述內容信息進行解析;
篩選模塊,用于對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出
檢索詞;
檢索模塊,用于基于所述檢索詞進行檢索,得到包含所述檢索詞的參考...
【專利技術屬性】
技術研發人員:陳志軍,張濤,汪平仄,
申請(專利權)人:小米科技有限責任公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。