本發明專利技術提供了一種文件存儲查詢代理以及信息查找方法與系統。所述文件存儲查詢代理包括:模版維護單元用于實現建立以及導入和導出配置模版,所述配置模版中預設需要提取的文件關鍵詞;與所述模版維護單元相連的索引建立單元,用于存儲文件時,根據所存儲的文件全文以及所述配置模版,搜索關鍵詞,提取關鍵詞位置建立索引數據;分別與所述索引建立單元以及所述模版維護單元相連的提取單元,用于讀取所述索引數據,根據查詢內容以及所述配置模版提取出關鍵詞;與所述提取單元相連的查找單元,用于根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。本發明專利技術實現了在大量文件中或者文件內部快速查找所需內容。
【技術實現步驟摘要】
本專利技術涉及數據查找
,尤其涉及ー種文件存儲查詢代理以及信息查找方法與系統。
技術介紹
在數據存儲應用中,大量的數據被存儲到永久存儲設備上,這些數據的應用通常需要通過查詢處理來實現。對于在大量的文件中,或在大尺寸的文件內部(尤其是超過50Mbytes大小的文件)查詢所需要的信息,是一件非常消耗計算機處理能力的事情,通常需要很長的時間才能遍歷搜索完所有的文件。因此查找速度上會較慢,而且還可能使存儲設備的響應變得緩慢。 因此需要ー種信息查找方法,可以快速地在大量文件中以及大尺寸的文件內部快速捜索到所需要的內容。
技術實現思路
本專利技術所要解決的技術問題是,提供ー種文件存儲查詢代理以及信息查找方法與系統,解決現有技術中在大量的文件中,或在大尺寸的文件內部查詢所需要的信息時查找速度較慢的技術問題。為了解決上述問題,本專利技術提供了ー種文件存儲查詢代理,包括模版維護單元、索引建立単元、提取單元以及查找單元;所述模版維護單元用于實現建立以及導入和導出配置模版,所述配置模版中預設需要提取的文件關鍵詞;所述索引建立単元與所述模版維護単元相連,用于存儲文件吋,根據所存儲的文件全文以及所述配置模版,捜索關鍵詞,提取關鍵詞位置建立索引數據;所述提取単元分別與所述索引建立單元以及所述模版維護單元相連,用于讀取所述索引數據,根據查詢內容以及所述配置模版提取出關鍵詞;所述查找単元與所述提取単元相連,用于根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。可選的,所述文件包括文本文件、ニ進制數據文件以及多媒體文件。可選的,所述索引數據存儲為一新的數據文件或保存在原文件的固定部位。進ー步,所述索引數據的索引內容包括至少ー關鍵詞、文件名及每一所述關鍵詞在文件中的偏移量。在文件追加存儲時,所述索引建立單元進一步根據所存儲的文件片段以及所述配置模版,捜索關鍵詞,提取關鍵詞位置更新索引數據。為了解決上述問題,本專利技術還提供了采用本專利技術所述文件存儲查詢代理的信息查找方法,包括如下步驟(I)通過文件存儲查詢代理建立索引數據;(2)接收文件查詢請求后啟動所述文件存儲查詢代理,其中,所述查詢請求中攜帯有查詢內容;(3)所述文件存儲查詢代理讀取索引數據,所述索引數據包括索引文件或文件中的索引信息;(4)根據查詢內容以及所述文件存儲查詢代理的配置模版提取出關鍵詞;(5)根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。所述步驟(I)進ー步包括(10)建立并導出配置模版,并在建立文件時導入所述配置模版,其中,所述配置模版中預設需要提取的文件關鍵詞。所述步驟(10)之后進ー步包括(11)接收文件保存請求并啟動所述文件存儲查詢代理;(12)根據所存儲的文件全文或文件片段以及所述配置模版,捜索關鍵詞;(13)提取關鍵詞位置建立索引數據。所述步驟(5)之后進ー步包括(6)打開相應文件,跳轉至與所述查詢內容匹配的信息的位置。為了解決上述問題,本專利技術還提供了ー種信息查找系統,包括接收模塊、啟動模塊以及文件存儲查詢代理;所述接收模塊用于接收文件查詢請求,其中,所述查詢請求中攜帯有查詢內容;所述啟動模塊分別與所述接收模塊以及所述文件存儲查詢代理相連,用于啟動所述文件存儲查詢代理;所述文件存儲查詢代理用于在文件建立時建立索引數據,在查找文件時讀取索引數據,根據查詢內容以及配置模版提取出關鍵詞,井根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。實現了在大量文件中或者大尺寸的文件內部快速查找所需要的內容;本專利技術簡單易于實現、可以快速檢索文件內容且關鍵詞可靈活配置;建立文件時可以實時生成索引數據;索引數據可以存儲為一単獨的索引文件或存儲在原文件地固定位置,索引數據可以緩存在內存中,以加快信息查找速度。附圖說明 圖1,本專利技術文件存儲查詢代理的架構 圖2,本專利技術信息查找方法的流程 圖3,本專利技術信息查找系統的架構圖。具體實施例方式下面結合附圖對本專利技術提供的文件存儲查詢代理以及信息查找方法與系統的具體實施方式做詳細說明。首先結合附圖給出本專利技術所述文件存儲查詢代理的具體實施方式。附圖1所示是本具體實施方式所述文件存儲查詢代理的架構圖,所述文件存儲查詢代理10包括模版維護單元11、索引建立単元12、提取單元13以及查找單元14。所述模版維護單元11用于實現建立以及導入和導出配置模版,所述配置模版中預設需要提取的文件關鍵詞。可以預先建立并導出配置模版,模版中預設需要提取的文件關鍵詞。關鍵詞可以根據不同的應用場合進行配置,比如手機號碼、姓名、単位或其它關鍵詞;關鍵詞可組合使用,即使用一個或多個關鍵詞。在建立文件時導入所述配置模版,當需要添加或修改關鍵詞時,可以對所述配置模版進行修改,并重新導入所建立的文件中。所建立的文件包括但不限于文本文件、ニ進制數據文件以及圖片、聲音視頻等各種多媒體文件。所述索引建立単元12與所述模版維護單元11相連,用于存儲文件時,根據所存儲的文件全文以及所述配置模版,捜索關鍵詞,提取關鍵詞位置建立索引數據。在文件追加存儲時,所述索引建立単元12進ー步根據所存儲的文件片段以及所述配置模版,捜索關鍵詞,提取關鍵詞位置更新索引數據。在大量小文件的場合,所述索引數據可以単獨存儲為一新的數據文件;在大尺寸文件時,可以存儲在原文件的固定部位,例如原文件的頭部或尾部,以及原文件中其它易于讀取的部位,但不限于此規則。索引數據可以緩存在內存中,以避免重復讀取索引信息。所述索引數據可以根據數據的格式使用包括Hash在內的任何索引形式;所述索引數據的索引內容包括至少ー關鍵詞、文件名及每一所述關鍵詞在文件中的偏移量(例如關鍵詞所在位置相對文件頭部的偏移量);可以使用ー個或多個關鍵詞。當已有的文件被編輯修改后,可以使用后臺重構索引的方法更新索引數據,即重新生成索引文件或文件中的索引信息。對于一次性寫入或追加寫入的文件應用場合,在寫時構造索引,可以避免二次打開文件遍歷所有文件構造索引;并且生成文件的同時,索引可以實時生成和使用。所述提取単元13分別與所述索引建立単元12以及所述模版維護單元11相連,用于讀取所述索引數據,根據查詢內容以及所述配置模版提取出關鍵詞。所述查找単元14與所述提取単元13相連,用于根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。即在查找相應文件信息時,先通過所述提取單元13讀取索引文件或文件中的索引信息,根據查詢內容,配合模版提取出關鍵詞;再通過所述查找單元14使用所提取的關鍵詞,在索引文件中查找出匹配的信息所在的文件位置,或在索引信息中查找出匹配的信息在原文件中的位置;然后打開相應文件,跳轉至對應的位置,取出相關的內容。接下來結合附圖給出本專利技術所述信息查找方法的具體實施方式。附圖2所示是本具體實施方式所述信息查找方法的流程圖,采用本專利技術所述文件存儲查詢代理,接下來對附圖2所示的步驟做詳細說明。S210 :通過文件存儲查詢代理建立索引數據。其中,所述步驟S210可以進ー步采用步驟S201 — S204來執行。S201 :建立并導出配置模版,并在建立文件時導入所述配置模版,其中,所述配置模版中預設需要提取的文件關鍵詞。可以預先建立并導出配置模版,模版中預設需要提取的文件關鍵詞本文檔來自技高網...
【技術保護點】
一種文件存儲查詢代理,其特征在于,包括模版維護單元、索引建立單元、提取單元以及查找單元;?所述模版維護單元用于實現建立以及導入和導出配置模版,所述配置模版中預設需要提取的文件關鍵詞;?所述索引建立單元與所述模版維護單元相連,用于存儲文件時,根據所存儲的文件全文以及所述配置模版,搜索關鍵詞,提取關鍵詞位置建立索引數據;?所述提取單元分別與所述索引建立單元以及所述模版維護單元相連,用于讀取所述索引數據,根據查詢內容以及所述配置模版提取出關鍵詞;?所述查找單元與所述提取單元相連,用于根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。
【技術特征摘要】
1.ー種文件存儲查詢代理,其特征在于,包括模版維護單元、索引建立単元、提取單元以及查找單元;所述模版維護單元用于實現建立以及導入和導出配置模版,所述配置模版中預設需要提取的文件關鍵詞;所述索引建立単元與所述模版維護單元相連,用于存儲文件時,根據所存儲的文件全文以及所述配置模版,捜索關鍵詞,提取關鍵詞位置建立索引數據;所述提取単元分別與所述索引建立單元以及所述模版維護單元相連,用于讀取所述索引數據,根據查詢內容以及所述配置模版提取出關鍵詞;所述查找単元與所述提取単元相連,用于根據所提取的關鍵詞在所述索引數據中查找出與所述查詢內容匹配的信息的位置。2.根據權利要求1所述的文件存儲查詢代理,其特征在于,所述文件包括文本文件、ニ進制數據文件以及多媒體文件。3.根據權利要求1所述的文件存儲查詢代理,其特征在于,所述索引數據存儲為一新的數據文件或保存在原文件的固定部位。4.根據權利要求1所述的文件存儲查詢代理,其特征在于,所述索引數據的索引內容包括至少ー關鍵詞、文件名及每一所述關鍵詞在文件中的偏移量。5.根據權利要求1所述的文件存儲查詢代理,其特征在于,在文件追加存儲時,所述索引建立單元進一步根據所存儲的文件片段以及所述配置模版,捜索關鍵詞,提取關鍵詞位置更新索引數據。6.ー種采用權利要求1所述的文件存儲查詢代理的信息查找方法,其特征在于,包括如下步驟(I)通過文件存儲查詢代理建立索引數據;(2)接收文件查詢請求后啟動所述文件存儲查詢代理...
【專利技術屬性】
技術研發人員:顧明毅,
申請(專利權)人:上海頂竹通訊技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。