• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    參考文檔的推薦方法及裝置制造方法及圖紙

    技術編號:14505249 閱讀:78 留言:0更新日期:2017-01-31 14:27
    本公開是關于一種參考文檔的推薦方法及裝置,通過獲取用戶正在操作的目標文檔的內容信息;并根據預設解析規則,對該內容信息進行解析;對解析后得到的關鍵信息進行篩選處理,以從關鍵信息中提取出檢索詞;并基于檢索詞進行檢索,得到包含檢索詞的參考文檔;再將參考文檔進行顯示。實現了隨時跟隨用戶撰寫的文檔,為其實時進行關鍵詞檢索服務,以提供匹配度高、精度高的參考文檔,滿足用戶需求,提升用戶體驗。

    【技術實現步驟摘要】

    本公開涉及信息檢索技術,尤其涉及一種參考文檔的推薦方法及裝置
    技術介紹
    隨著社會的快速發展,科學技術的不斷進步,人們所能觸及到的信息呈現幾何式的增長,人們越來越需要借助信息搜索技術在海量的信息中挖掘出有效信息。目前,用戶在用office等辦公軟件,如word寫論文、報告等文章前,通常需要進行參考文獻的檢索,檢索過程一般是根據文章的主體思想,設定幾個關鍵詞語,并利用百度搜索、谷歌搜索等搜索引擎進行關鍵詞語的檢索,然后在搜索到的信息中查找是否有自己需要的有用信息。檢索的效果好壞很大程度上取決于用戶對檢索技巧掌握,如關鍵詞選擇是否合適,從搜索到的海量信息中快速定位有價值信息的個人能力等種種因素。公開內容為克服相關技術中存在的問題,本公開提供一種參考文檔的推薦方法及裝置,所述技術方案如下:根據本公開實施例的第一方面,提供一種參考文檔的推薦方法,包括:獲取用戶正在操作的目標文檔的內容信息;根據預設解析規則,對所述內容信息進行解析;對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;將所述參考文檔進行顯示。可選的,所述預設解析規則包括:標志內容提取規則、分詞規則;所述根據預設解析規則,對所述內容信息進行解析,包括:根據所述標志內容提取規則,提取所述內容信息中的標志內容;所述標志內容包括以下至少一項:所述目標文檔中指明的關鍵詞、所述目標文檔標題;根據所述分詞規則對提取所述標志內容后的內容信息進行分詞處理,得到分詞處理后的各個詞語片斷。可選的,所述關鍵信息包括:所述標志內容、所述詞語片斷;相應的,所述對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞包括:將各個所述詞語片斷中的不相關詞語刪除;所述不相關詞語包括以下一種或多種:連接詞語、單字詞語、稱謂詞語;對刪除處理后剩余的各個詞語片斷進行重復出現頻度排序;根據頻度由大到小的順序,從排序第一位的詞語片斷開始選出滿足預設閾值個數的詞語片斷,并在所述選出的詞語片斷中去除與所述標志內容一致的詞語片斷,得到篩選后的詞語片斷;所述篩選后的詞語片斷與所述標志內容構成所述檢索詞。可選的,所述基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔,包括:將所述檢索詞導入搜索庫中進行檢索,得到包含所述檢索詞的參考文檔;所述搜索庫包含以下一種或多種:本地存儲介質、用戶預設的云存儲設備、公共搜索引擎資源。可選的,還包括:所述基于所述檢索詞進行檢索之后,根據預設評價規則,對檢索得到的文檔進行評價處理;所述評價規則包括以下一種或多種:被引用次數因子、文檔好評率、文檔質量程度。相應的,所述得到包含檢索詞的參考文檔包括:根據所述評價處理結果對檢索得到的所述參考文檔進行優先級排序,以使所述參考文檔具有優先級順序。可選的,還包括:所述對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞之后,根據所述檢索詞在所述目標文檔中所處位置與用戶當前輸入字符位置之間的距離,或者根據所述檢索詞在所述目標文檔中的權重值,對所述檢索詞進行優先級排序;相應的,所述基于所述檢索詞進行檢索,包括:基于排序得到的所述檢索詞的優先級順序進行檢索。可選的,所述方法還包括:對所述目標文檔進行語義理解分析,獲取所述目標文檔的主題屬性;相應的,所述得到與所述目標文檔相似的參考文檔之后,還包括:根據所述主題屬性對所述參考文檔進行排序,將與所述主題屬性匹配度高的參考文檔進行優先顯示。可選的,所述將所述參考文檔進行顯示包括:所述參考文檔與所述目標文檔位于同一顯示窗口內,或者所述參考文檔與所述目標文檔位于不同顯示窗口內。可選的,所述參考文檔與所述目標文檔位于同一顯示窗口內包括:所述參考文檔與所述目標文檔分欄顯示,所述參考文檔位于所述顯示窗口的任意一側;或者,所述參考文檔以浮窗形式覆蓋顯示于所述目標文檔表面。根據本公開實施例的第二方面,提供一種參考文檔的推薦裝置,包括:獲取模塊,用于獲取用戶正在操作的目標文檔的內容信息;解析模塊,用于根據預設解析規則,對所述內容信息進行解析;篩選模塊,用于對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;檢索模塊,用于基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;顯示模塊,用于將所述參考文檔進行顯示。可選的,所述預設解析規則包括:標志內容提取規則、分詞規則;相應的,所述解析模塊,包括:提取子模塊,用于根據所述標志內容提取規則,提取所述內容信息中的標志內容;所述標志內容包括以下至少一項:所述目標文檔中指明的關鍵詞、所述目標文檔標題;處理子模塊,用于根據所述分詞規則對所述提取子模塊提取所述標志內容后的內容信息進行分詞處理,得到分詞處理后的各個詞語片斷。可選的,所述關鍵信息包括:所述標志內容、所述詞語片斷;相應的,所述篩選模塊,包括:刪除子模塊,用于將各個所述詞語片斷中的不相關詞語刪除;所述不相關詞語包括以下一種或多種:連接詞語、單字詞語、稱謂詞語;排序子模塊,用于對所述刪除子模塊刪除處理后剩余的各個詞語片斷進行重復出現頻度排序;選擇子模塊,用于根據頻度由大到小的順序,從排序第一位的詞語片斷開始選出滿足預設閾值個數的詞語片斷;去重子模塊,用于在所述選擇子模塊選出的詞語片斷中去除與所述標志內容一致的詞語片斷,得到篩選后的詞語片斷;所述篩選后的詞語片斷與所述標志內容構成所述檢索詞。可選的,所述檢索模塊,包括:導入子模塊,用于將所述檢索詞導入搜索庫;第一檢索子模塊,用于對所述導入子模塊導入后的所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;所述搜索庫包含以下一種或多種:本地存儲介質、用戶預設的云存儲設備、公共搜索引擎資源。可選的,所述裝置還包括:評價模塊,用于根據預設評價規則,對檢索得到的文檔進行評價處理;所述評價規則包括以下一種或多種:被引用次數因子、文檔好評率、文檔質量程度;相應的,所述參考文檔為根據所述評價處理結果對檢索得到的文檔進行優先級排序后的文檔。可選的,所述裝置還包括:第一排序模塊,用于根據所述檢索詞在所述目標文檔中所處位置與用戶當前輸入字符位置之間的距離,或者根據所述檢索詞在所述目標文檔中的權重值,對所述檢索詞進行優先級排序;相應的,所述檢索模塊,包括:第二檢索子模塊,用于基于所述第一排序模塊排本文檔來自技高網...

    【技術保護點】
    一種參考文檔的推薦方法,其特征在于,包括:獲取用戶正在操作的目標文檔的內容信息;根據預設解析規則,對所述內容信息進行解析;對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;將所述參考文檔進行顯示。

    【技術特征摘要】
    1.一種參考文檔的推薦方法,其特征在于,包括:
    獲取用戶正在操作的目標文檔的內容信息;
    根據預設解析規則,對所述內容信息進行解析;
    對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出檢索詞;
    基于所述檢索詞進行檢索,得到包含所述檢索詞的參考文檔;
    將所述參考文檔進行顯示。
    2.根據權利要求1所述的方法,其特征在于,所述預設解析規則包括:標志內容提
    取規則、分詞規則;所述根據預設解析規則,對所述內容信息進行解析,包括:
    根據所述標志內容提取規則,提取所述內容信息中的標志內容;所述標志內容包括以
    下至少一項:所述目標文檔中指明的關鍵詞、所述目標文檔標題;
    根據所述分詞規則對提取所述標志內容后的內容信息進行分詞處理,得到分詞處理后
    的各個詞語片斷。
    3.根據權利要求2所述的方法,其特征在于,所述關鍵信息包括:所述標志內容、
    所述詞語片斷;相應的,所述對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息
    中提取出檢索詞包括:
    將各個所述詞語片斷中的不相關詞語刪除;所述不相關詞語包括以下一種或多種:連
    接詞語、單字詞語、稱謂詞語;
    對刪除處理后剩余的各個詞語片斷進行重復出現頻度排序;
    根據頻度由大到小的順序,從排序第一位的詞語片斷開始選出滿足預設閾值個數的詞
    語片斷,并在所述選出的詞語片斷中去除與所述標志內容一致的詞語片斷,得到篩選后的
    詞語片斷;所述篩選后的詞語片斷與所述標志內容構成所述檢索詞。
    4.根據權利要求1所述的方法,其特征在于,所述基于所述檢索詞進行檢索,得到
    包含所述檢索詞的參考文檔,包括:
    將所述檢索詞導入搜索庫中進行檢索,得到包含所述檢索詞的參考文檔;所述搜索庫
    包含以下一種或多種:本地存儲介質、用戶預設的云存儲設備、公共搜索引擎資源。
    5.根據權利要求1所述的方法,其特征在于,還包括:所述基于所述檢索詞進行檢
    索之后,
    根據預設評價規則,對檢索得到的文檔進行評價處理;所述評價規則包括以下一種或

    \t多種:被引用次數因子、文檔好評率、文檔質量程度。
    相應的,所述得到包含檢索詞的參考文檔包括:
    根據所述評價處理結果對檢索得到的所述參考文檔進行優先級排序,以使所述參考文
    檔具有優先級順序。
    6.根據權利要求1所述的方法,其特征在于,還包括:所述對解析后得到的關鍵信
    息進行篩選處理,以從所述關鍵信息中提取出檢索詞之后,
    根據所述檢索詞在所述目標文檔中所處位置與用戶當前輸入字符位置之間的距離,或
    者根據所述檢索詞在所述目標文檔中的權重值,對所述檢索詞進行優先級排序;
    相應的,所述基于所述檢索詞進行檢索,包括:
    基于排序得到的所述檢索詞的優先級順序進行檢索。
    7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
    對所述目標文檔進行語義理解分析,獲取所述目標文檔的主題屬性;
    相應的,所述得到與所述目標文檔相似的參考文檔之后,還包括:
    根據所述主題屬性對所述參考文檔進行排序,將與所述主題屬性匹配度高的參考文檔
    進行優先顯示。
    8.根據權利要求1所述的方法,其特征在于,所述將所述參考文檔進行顯示包括:
    所述參考文檔與所述目標文檔位于同一顯示窗口內顯示,或者所述參考文檔與所述目
    標文檔位于不同顯示窗口內顯示。
    9.根據權利要求8所述的方法,其特征在于,所述參考文檔與所述目標文檔位于同
    一顯示窗口內包括:
    所述參考文檔與所述目標文檔分欄顯示,所述參考文檔位于所述顯示窗口的任意一
    側;或者,所述參考文檔以浮窗形式覆蓋顯示于所述目標文檔表面。
    10.一種參考文檔的推薦裝置,其特征在于,包括:
    獲取模塊,用于獲取用戶正在操作的目標文檔的內容信息;
    解析模塊,用于根據預設解析規則,對所述內容信息進行解析;
    篩選模塊,用于對解析后得到的關鍵信息進行篩選處理,以從所述關鍵信息中提取出
    檢索詞;
    檢索模塊,用于基于所述檢索詞進行檢索,得到包含所述檢索詞的參考...

    【專利技術屬性】
    技術研發人員:陳志軍張濤汪平仄
    申請(專利權)人:小米科技有限責任公司
    類型:發明
    國別省市:北京;11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲综合无码一区二区三区| 久久午夜无码免费| 67194成是人免费无码| 久久久久无码精品国产app| 国产AV无码专区亚洲AWWW| 亚洲国产成人精品无码一区二区 | 日韩人妻无码精品久久免费一 | 无码人妻丰满熟妇啪啪网站| 欧日韩国产无码专区| 老司机亚洲精品影院无码| 日韩综合无码一区二区| 亚洲成av人无码亚洲成av人| 国产无遮挡无码视频免费软件| 97在线视频人妻无码| 亚洲午夜无码久久| 精品日韩亚洲AV无码| 亚洲AV无码成人精品区在线观看 | 精品人妻系列无码人妻漫画| 亚洲成av人片在线观看无码不卡| 伊人无码精品久久一区二区| 丝袜无码一区二区三区| 免费无码黄网站在线观看| 91精品久久久久久无码| 亚洲AV综合色区无码一区爱AV| 全免费a级毛片免费看无码| 亚洲AV无码一区二区三区牛牛| 久久精品无码精品免费专区| 熟妇人妻系列aⅴ无码专区友真希| 无码办公室丝袜OL中文字幕| 免费无码AV片在线观看软件| 亚洲国产精品无码久久九九大片| 亚洲日韩乱码中文无码蜜桃臀| 日韩午夜福利无码专区a| 精品无码久久久久国产| 亚洲av无码专区在线| 亚洲精品无码人妻无码| 无码人妻一区二区三区av| 免费无码黄动漫在线观看| 亚洲AV无码一区二区三区国产| 久久久久成人精品无码| 日韩欧国产精品一区综合无码|