本發明專利技術公開加密數據文件存儲和檢索方法,包含:數據文件提取內容元數據后進行加密生成加密數據文件存儲于云存儲系統的存儲設備;內容元數據添加數據文件在加密狀態下的文件全局標識符后存儲于云存儲系統的內容元數據庫;檢索云存儲系統中存儲的加密數據文件時,通過倒排索引方法檢索內容元數據庫獲得與檢索關鍵詞匹配的文件全局標識符,列出該文件全局標識符對應的加密數據文件的屬性信息和內容信息作為檢索結果。本發明專利技術在數據文件加密前提取內容元數據,內容元數據中添加文件在加密狀態下的文件全局標識符,通過文件全局標識符檢索存儲在云存儲系統的加密數據文件,保障數據文件在云存儲環境中的安全性和隱私性同時,保障數據文件檢索的便利性。
【技術實現步驟摘要】
本專利技術涉及信息安全
,具體涉及一種基于云存儲系統的加密數據文件存儲和檢索系統及方法。
技術介紹
相比傳統的數據文件存儲方式,云存儲技術具有很多的優勢:(1)成本低廉,傳統方式下,用戶需要購買大量的服務器、硬盤等基礎設備,而且還需要定期對設備進行升級,而在云存儲環境中,用戶不再需要購買這些基礎設備,一方面節省了購買基礎設備的成本,另一方面也減少了維護的費用;(2)伸縮性好,對于中小企業來說,前期很難估算需要的存儲容量大小,而云存儲可以很好的解決這一問題,前期可以根據當前需要購買滿足需求的存儲容量,當業務增長,數據量增多時,可以動態的增加存儲容量而不影響之前的數據;(3)數據自動備份,為了數據安全,很多用戶都會將數據進行備份,而備份往往比較繁瑣而且存在備份數據安全和完整性保護問題,云存儲供應商一般給數據文件提供兩個或兩個以上的副本,充分保證數據文件的高可用性,從而將用戶從數據備份的煩惱中解救出來;(4)故障自動切換,傳統的存儲系統升級時,需要將數據從舊的存儲中遷移到別的存儲服務器上,等新的存儲服務器上線之后,再將數據遷移回來,一方面會造成服務的中斷,另一方面也會帶來數據丟失的風險,而在云存儲環境中這些問題都將不復存在,系統檢測到異常時,會自動將服務切換到可用的冗余存儲集群上,而不影響正常的服務,更不會丟失數據。雖然云存儲具有諸多的優勢,但也存在一些不足,尤其突出的一點是越來越多的用戶擔心:自己的數據存儲在由他人管理和控制的云存儲系統環境中,有可能泄露數據的內容,給個人和公司帶來損失。目前解決此類問題的方法是將數據以加密的形式存儲在云存儲系統中。雖然將數據文件加密存儲,可以保護數據文件的隱私性和安全性,但是同時也帶來了一個問題:在很多場景下,用戶需要根據一些特定的內容來檢索數據文件,如果數據文件加密了,就導致無法檢索,或者檢索速度緩慢。
技術實現思路
本專利技術提供一種加密數據文件存儲和檢索系統及方法,解決加密數據文件檢索困難和檢索速度慢的問題,能夠在數據文件處于加密狀態的基礎上,快速的檢索出所需的加密數據文件信息。為實現上述目的,本專利技術提供一種加密數據文件存儲和檢索系統,其特點是,該系統包含:云存儲系統,其包含服務器端和存儲設備;服務器端包含用戶身份認證模塊、內容元數據提取模塊、元數據管理系統、數據文件加密模塊、信息檢索模塊;元數據管理系統下接并管理內容元數據庫、系統元數據庫和存儲元數據庫;存儲設備,其用于存儲數據文件,數據文件包含加密數據文件和明文數據文件;客戶端,其包含內容元數據提取模塊和數據文件加密模塊。一種加密數據文件存儲和檢索方法,其特點是,該方法包含:客戶端或云存儲系統服務器端提取數據文件的內容元數據后進行加密生成加密數據文件,加密數據文件及對應的內容元數據分別存儲于云存儲系統的存儲存儲設備和服務器端的內容元數據庫中;內容元數據包含數據文件的屬性信息和內容信息,以及數據文件在加密狀態下的文件全局標識符;檢索云存儲系統中存儲的加密數據文件時,服務端的加密數據文件檢索模塊通過倒排索引方法,在服務器端的內容元數據庫中檢索獲得與檢索關鍵詞匹配的數據文件在加密狀態下的文件全局標識符,列出該文件全局標識符對應的加密數據文件的屬性信息和內容信息作為檢索結果返回。上述客戶端提取數據文件的內容元數據后進行加密生成加密數據文件的方法包含:客戶端提取數據文件的內容元數據;客戶端加密已提取內容元數據的數據文件,生成加密數據文件;客戶端將加密數據文件及對應的內容元數據上傳至云存儲系統服務器端。上述云存儲系統服務器端提取數據文件的內容元數據后進行加密生成加密數據文件的方法包含:客戶端將數據文件上傳至云存儲系統服務器端;云存儲系統服務器端提取數據文件的內容元數據;云存儲系統服務器端對已提取內容元數據的數據文件加密,生成加密數據文件。上述提取數據文件的內容元數據包含:客戶端或云存儲系統服務器端的內容元數據提取模塊根據數據文件的特性,對數據文件內容做初步的分析,提取能體現數據文件特性的屬性信息和內容信息,并將數據文件加密后的文件全局標識符添加到內容元數據中。上述提取數據文件的內容元數據后,客戶端可對存儲于云存儲系統服務器端內容元數據庫中的內容元數據進行修改。上述云存儲系統服務器端將加密數據文件分布式存儲在云存儲系統的存儲設備,并將內容元數據存儲于云存儲系統的內容元數據庫中。上述檢索云存儲系統服務器端中存儲的加密數據文件包含:客戶端發送包含檢索關鍵詞的檢索請求,云存儲系統分析檢索請求確定檢索請求中檢索關鍵詞內容的合法性;云存儲系統的信息檢索模塊通過倒排索引方法對內容元數據庫進行匹配查詢,獲取與檢索關鍵詞匹配的數據文件在加密狀態下的文件全局標識符和文件全局標識符對應的數據文件的屬性信息和內容信息作為檢索結果;信息檢索模塊將檢索結果進行排序后發送至客戶端。上述客戶端根據檢索結果,可選擇下載檢索結果中所列的文件全局標識符對應的加密數據文件;若加密數據文件是在客戶端加密則云存儲系統直接將加密數據文件傳到用戶客戶端,由客戶端進行解密;若加密數據文件是在云存儲系統服務器端加密,則由云存儲系統服務器端將加密數據文件解密后傳到客戶端。上述加密數據文件的檢索方法還包含倒排索引方法的優化方法,該倒排索引方法的優化方法包含:經過垂直分割和水平移動,使數據文件內容元數據的倒排索引矩陣的零元素移到矩陣的底部和右部;再經過分塊聚類,將原來的高維稀疏矩陣轉變為若干個低維稠密矩陣;對內容元數據檢索時,將優化的稀疏矩陣中若干個的低維矩陣分別送到云存儲系統中的不同處理單元進行并行處理。本專利技術加密數據文件存儲和檢索系統及方法和現有技術的加密數據文件存儲和檢索技術相比,其優點在于,本專利技術建立了一種新型的內容元數據結構,保證用戶從多角度、多方位對加密數據文件的檢索,保障了數據文件在云存儲環境中的安全性和隱私性同時,保障了數據文件檢索的便利性;本專利技術中數據文件都是以加密方式保存在云存儲系統中,即使得到加密的數據文件,沒有解密密鑰,數據文件也不會泄露;本專利技術設計一種適合于內容元數據檢索的新型倒排索引方法,能夠根據用戶在客戶端提供的關鍵詞信息在云存儲系統中快速檢索出對應的加密數據文件,保證了用戶加密數據文件檢索的效率和精度,解決了云存儲等大數據環境中的加密數據文件檢索難或檢索速度慢的問題;本專利技術對于云存儲系統中的加密數據文件和明文數據文件的檢索同樣適用,都能達到快速檢索并返回檢索結果的目的。附圖說明圖1為本專利技術加密數據文件存儲和檢索方法的流程示意圖;圖2為三種元數據關系圖;圖3為內容元數據結構圖;圖4為存儲元數據結構圖;圖5為一種基于云存儲系統的加密數據文件存儲和檢索方法實施例的方法流程圖;圖6為加密數據文件的檢索模型圖;圖7為內容元數據的倒排索引示意圖;
...
【技術保護點】
一種加密數據文件存儲和檢索系統,其特征在于,該系統包含:云存儲系統,其包含服務器端和存儲設備;所述的服務器端包含用戶身份認證模塊、內容元數據提取模塊、元數據管理系統、數據文件加密模塊、信息檢索模塊;所述的元數據管理系統下接并管理內容元數據庫、系統元數據庫和存儲元數據庫;所述的存儲設備,其用于存儲數據文件,數據文件包含加密數據文件和明文數據文件;客戶端,其包含內容元數據提取模塊和數據文件加密模塊。
【技術特征摘要】
1.一種加密數據文件存儲和檢索系統,其特征在于,該系統包含:
云存儲系統,其包含服務器端和存儲設備;所述的服務器端包含用戶身份認證模塊、內容元數據提取模塊、元數據管理系統、數據文件加密模塊、信息檢索模塊;所述的元數據管理系統下接并管理內容元數據庫、系統元數據庫和存儲元數據庫;所述的存儲設備,其用于存儲數據文件,數據文件包含加密數據文件和明文數據文件;
客戶端,其包含內容元數據提取模塊和數據文件加密模塊。
2.一種加密數據文件存儲和檢索方法,其特征在于,該方法包含:
客戶端或云存儲系統服務器端提取數據文件的內容元數據后進行加密生成加密數據文件,加密數據文件及對應的內容元數據分別存儲于云存儲系統的存儲存儲設備和服務器端的內容元數據庫中;內容元數據包含數據文件的屬性信息和內容信息,以及數據文件在加密狀態下的文件全局標識符;
檢索云存儲系統中存儲的加密數據文件時,服務端的加密數據文件檢索模塊通過倒排索引方法,在服務器端的內容元數據庫中檢索獲得與檢索關鍵詞匹配的數據文件在加密狀態下的文件全局標識符,列出該文件全局標識符對應的加密數據文件的屬性信息和內容信息作為檢索結果返回。
3.如權利要求2所述加密數據文件存儲和檢索方法,其特征在于,所述客戶端提取數據文件的內容元數據后進行加密生成加密數據文件的方法包含:
客戶端提取數據文件的內容元數據;
客戶端加密已提取內容元數據的數據文件,生成加密數據文件;
客戶端將加密數據文件及對應的內容元數據上傳至云存儲系統服務器端。
4.如權利要求2所述加密數據文件存儲和檢索方法,其特征在于,所述云存儲系統服務器端提取數據文件的內容元數據后進行加密生成加密數據文件的方法包含:
客戶端將數據文件上傳至云存儲系統服務器端;
云存儲系統服務器端提取數據文件的內容元數據;
云存儲系統服務器端對已提取內容元數據的數據文件加密,生成加密數據文件。
5.如權利要求2或3或4所述加密數據文件存儲和檢索方法,其特征在于,所述提取數據文件的內容元數據包含:客戶端或云存儲系統服務器端的內容元數據提取...
【專利技術屬性】
技術研發人員:韓德志,畢坤,戴永濤,陳付梅,
申請(專利權)人:上海海事大學,
類型:發明
國別省市:上海;31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。