• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種可擴展標記語言XML文檔的壓縮、解壓方法和裝置制造方法及圖紙

    技術編號:14854452 閱讀:124 留言:0更新日期:2017-03-18 21:50
    本申請實施例提供了一種可擴展標記語言XML文檔的壓縮、解壓方法和裝置,該壓縮方法包括:從原始的可擴展標記語言XML文檔中讀取文檔參數;將所述文檔參數映射為映射碼;將所述映射碼替換所述文檔參數,獲得壓縮的可擴展標記語言XML文檔。由于文檔參數很多情況下存在重復,因此,替換之后可以大大減少XML文檔存儲的數據量,提高了壓縮效率,并且,映射操作簡單,減少了壓縮的耗時。

    【技術實現步驟摘要】

    本申請涉及計算機處理的
    ,特別是涉及一種可擴展標記語言XML文檔的壓縮方法、一種可擴展標記語言XML文檔的解壓方法、一種可擴展標記語言XML文檔的壓縮裝置和一種可擴展標記語言XML文檔的解壓裝置。
    技術介紹
    XML(ExtensibleMarkupLanguage,可擴展標記語言)文檔可以對數據進行結構化處理,從而能夠在部門、客戶和供應商之間進行交換,實現動態內容生成,企業集成和應用開發。XML文檔可以使用戶能夠更準確的搜索,更方便的傳送應用組件,更好的描述一些事物,如電子商務交易等。為方便傳輸或存儲,通常對XML文檔進行壓縮。由于XML文檔是一個文本文檔,通常壓縮文本文檔的方法主要是GZIP壓縮,GZIP對于需要壓縮的文檔,首先使用LZ77算法的一個變種進行壓縮,對得到的結果再使用Huffman編碼的方法進行壓縮。可見,GZIP壓縮是一個通用的文本壓縮方法,因此普遍性高,也就是任意一個文本文檔都可以使用GZIP壓縮,但是,這種壓縮方法壓縮操作復雜,耗時較高,應用在XML文檔壓縮時,壓縮后的XML文檔的體積依然較大,壓縮效率較低。由于XML文檔的體積較大,因此,在傳輸或存儲壓縮后的XML文檔時,會消耗較大的帶寬或占用較多的存儲空間。在解壓縮時,需要對Huffman編碼和LZ77算法進行反向解壓縮,解壓操作復雜,耗時也較高。
    技術實現思路
    鑒于上述問題,提出了本申請實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種針對可擴展標記語言XML文檔的壓縮方法、一種針對可擴展標記語言XML文檔的解壓方法和相應的一種針對可擴展標記語言XML文檔的壓縮裝置、一種針對可擴展標記語言XML文檔的解壓裝置。為了解決上述問題,本申請實施例公開了一種可擴展標記語言XML文檔的壓縮方法,包括:從原始的可擴展標記語言XML文檔中讀取文檔參數;將所述文檔參數映射為映射碼;將所述映射碼替換所述文檔參數,獲得壓縮的可擴展標記語言XML文檔??蛇x地,還包括:將所述文檔參數與所述映射碼之間的映射關系嵌入所述可擴展標記語言XML文檔中??蛇x地,還包括:傳輸和/或存儲壓縮的可擴展標記語言XML文檔??蛇x地,所述文檔參數包括元素和/或屬性。可選地,所述將所述文檔參數映射為映射碼的步驟包括:對所述文檔參數進行去重處理;將去重處理之后的文檔參數映射為唯一的映射碼,所述映射碼的字符串長度小于或等于所述文檔參數的字符串長度??蛇x地,所述將去重處理之后的文檔參數映射為唯一的映射碼的步驟包括:從去重處理之后的文檔參數提取候選字符串;判斷所述候選字符串是否與已映射的映射碼相同;當不相同時,確認所述候選字符串為所述文檔參數的映射碼;當相同時,從所述文檔參數中提取包含所述候選字符串的目標字符串,作為新的候選字符串,返回執行所述判斷所述候選字符串是否與已映射的映射碼相同的步驟。可選地,所述將去重處理之后的文檔參數映射為唯一的映射碼的步驟還包括:按照字符串長度和/或字符順序對去重處理之后的文檔參數進行排序。本申請實施例還公開了一種可擴展標記語言XML文檔的解壓方法,包括:獲取壓縮的可擴展標記語言XML文檔,壓縮的可擴展標記語言XML文檔中包括映射碼;查找壓縮的可擴展標記語言XML文檔的、映射碼與文檔參數之間的映射關系;按照所述映射關系將所述文檔參數替換所述映射碼,獲得原始的可擴展標記語言XML文檔??蛇x地,還包括:當所述映射關系嵌在壓縮的可擴展標記語言XML文檔中時,刪除所述映射關系??蛇x地,所述獲取壓縮的可擴展標記語言XML文檔的步驟包括:讀取在先存儲的壓縮的可擴展標記語言XML文檔;或者,接收傳輸到來的壓縮的可擴展標記語言XML文檔。本申請實施例還公開了一種可擴展標記語言XML文檔的壓縮裝置,包括:文檔參數讀取模塊,用于從原始的可擴展標記語言XML文檔中讀取文檔參數;映射模塊,用于將所述文檔參數映射為映射碼;文檔參數替換模塊,用于將所述映射碼替換所述文檔參數,獲得壓縮的可擴展標記語言XML文檔??蛇x地,還包括:映射關系嵌入模塊,用于將所述文檔參數與所述映射碼之間的映射關系嵌入所述可擴展標記語言XML文檔中??蛇x地,還包括:傳輸模塊,用于傳輸壓縮的可擴展標記語言XML文檔;和/或,存儲模塊,用于存儲壓縮的可擴展標記語言XML文檔。可選地,所述文檔參數包括元素和/或屬性??蛇x地,所述映射模塊包括:去重子模塊,用于對所述文檔參數進行去重處理;去重映射子模塊,用于將去重處理之后的文檔參數映射為唯一的映射碼,所述映射碼的字符串長度小于或等于所述文檔參數的字符串長度。可選地,所述去重映射子模塊包括:候選字符串提取單元,用于從去重處理之后的文檔參數提取候選字符串;映射碼判斷單元,用于判斷所述候選字符串是否與已映射的映射碼相同;當不相同時,調用映射碼確認單元,當相同時,調用目標字符串提取單元,返回調用映射碼判斷單元;映射碼確認單元,用于確認所述候選字符串為所述文檔參數的映射碼;目標字符串提取單元,用于從所述文檔參數中提取包含所述候選字符串的目標字符串,作為新的候選字符串。可選地,所述去重映射子模塊還包括:排序單元,用于按照字符串長度和/或字符順序對去重處理之后的文檔參數進行排序。本申請實施例還公開了一種可擴展標記語言XML文檔的解壓裝置,包括:XML文檔獲取模塊,用于獲取壓縮的可擴展標記語言XML文檔,壓縮的可擴展標記語言XML文檔中包括映射碼;映射關系查找模塊,用于查找壓縮的可擴展標記語言XML文檔的、映射碼與文檔參數之間的映射關系;映射碼替換模塊,用于按照所述映射關系將所述文檔參數替換所述映射碼,獲得原始的可擴展標記語言XML文檔??蛇x地,還包括:映射關系刪除模塊,用于在所述映射關系嵌在壓縮的可擴展標記語言XML文檔中時,刪除所述映射關系??蛇x地,所述XML文檔獲取模塊包括:XML文檔讀取子模塊,用于讀取在先存儲的壓縮的可擴展標記語言XML文檔;或者,XML文檔接收子模塊,用于接收傳輸到來的壓縮的可擴展標記語言XML文檔。本申請實施例包括以下優點:本申請實施例通過對原始的XML文檔的文檔參數進行映射,將映射碼替換文檔參數,實現壓縮,由于文檔參數很多情況下存在重復,因此,替換之后可以大大減少XML文檔存儲的數據量,提高了壓縮效率,并且,映射操作簡單,減少了壓縮的耗時。進而,在傳輸、存儲壓縮的XML文檔時,可以減少帶寬的消耗,或者,較少存儲空間的占用。本申請實施例對文檔參數進行去重處理之后映射為唯一的映射碼,文檔參數的唯一性保證了映射碼的唯一性,從而保證兩者可以相互轉換,保證了壓縮之后恢復操作的準確性。本申請實施例依次增大候選字符串的長度進行映射檢測,在保證映射碼的唯一性的同時,減少了映射碼的長度。本申請實施例通過映射關系,將原始的文檔參數替換映射碼,映射操作簡單,減少了解壓的耗時。附圖說明圖1是本申請的一種可擴展標記語言XML文檔的壓縮方法實施例的步驟流程圖;圖2是本申請實施例的一種XML文檔的結構示例圖;圖3是本申請的一種可擴展標記語言XML文檔的解壓方法實施例的步驟流程圖;圖4是本申請的一種可擴展標記語言XML文檔的壓縮裝置實施例的結構框圖;圖5是本申請的一種可擴展標本文檔來自技高網...
    一種<a  title="一種可擴展標記語言XML文檔的壓縮、解壓方法和裝置原文來自X技術">可擴展標記語言XML文檔的壓縮、解壓方法和裝置</a>

    【技術保護點】
    一種可擴展標記語言XML文檔的壓縮方法,其特征在于,包括:從原始的可擴展標記語言XML文檔中讀取文檔參數;將所述文檔參數映射為映射碼;將所述映射碼替換所述文檔參數,獲得壓縮的可擴展標記語言XML文檔。

    【技術特征摘要】
    1.一種可擴展標記語言XML文檔的壓縮方法,其特征在于,包括:從原始的可擴展標記語言XML文檔中讀取文檔參數;將所述文檔參數映射為映射碼;將所述映射碼替換所述文檔參數,獲得壓縮的可擴展標記語言XML文檔。2.根據權利要求1所述的方法,其特征在于,還包括:將所述文檔參數與所述映射碼之間的映射關系嵌入所述可擴展標記語言XML文檔中。3.根據權利要求1或2所述的方法,其特征在于,還包括:傳輸和/或存儲壓縮的可擴展標記語言XML文檔。4.根據權利要求1所述的方法,其特征在于,所述文檔參數包括元素和/或屬性。5.根據權利要求1或2或4所述的方法,其特征在于,所述將所述文檔參數映射為映射碼的步驟包括:對所述文檔參數進行去重處理;將去重處理之后的文檔參數映射為唯一的映射碼,所述映射碼的字符串長度小于或等于所述文檔參數的字符串長度。6.根據權利要求5所述的方法,其特征在于,所述將去重處理之后的文檔參數映射為唯一的映射碼的步驟包括:從去重處理之后的文檔參數提取候選字符串;判斷所述候選字符串是否與已映射的映射碼相同;當不相同時,確認所述候選字符串為所述文檔參數的映射碼;當相同時,從所述文檔參數中提取包含所述候選字符串的目標字符串,作為新的候選字符串,返回執行所述判斷所述候選字符串是否與已映射的映射碼相同的步驟。7.根據權利要求6所述的方法,其特征在于,所述將去重處理之后的文檔參數映射為唯一的映射碼的步驟還包括:按照字符串長度和/或字符順序對去重處理之后的文檔參數進行排序。8.一種可擴展標記語言XML文檔的解壓方法,其特征在于,包括:獲取壓縮的可擴展標記語言XML文檔,壓縮的可擴展標記語言XML文檔中包括映射碼;查找壓縮的可擴展標記語言XML文檔的、映射碼與文檔參數之間的映射關系;按照所述映射關系將所述文檔參數替換所述映射碼,獲得原始的可擴展標記語言XML文檔。9.根據權利要求8所述的方法,其特征在于,還包括:當所述映射關系嵌在壓縮的可擴展標記語言XML文檔中時,刪除所述映射關系。10.根據權利要求8或9所述的方法,其特征在于,所述獲取壓縮的可擴展標記語言XML文檔的步驟包括:讀取在先存儲的壓縮的可擴展標記...

    【專利技術屬性】
    技術研發人員:魏強,
    申請(專利權)人:阿里巴巴集團控股有限公司
    類型:發明
    國別省市:開曼群島;KY

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品人妻无码专区在中文字幕| 无码国内精品久久人妻蜜桃| 无码中文字幕日韩专区视频| 中文无码热在线视频| 国产成人无码av在线播放不卡 | 国产做无码视频在线观看浪潮| 亚洲av无码专区在线| 国产a级理论片无码老男人| 狠狠躁夜夜躁无码中文字幕| 下载天堂国产AV成人无码精品网站| 内射人妻少妇无码一本一道| 亚洲精品无码久久久久久久| 成在线人免费无码高潮喷水| 亚洲AV无码成人精品区狼人影院 | 久久无码精品一区二区三区| 一道久在线无码加勒比| 秋霞鲁丝片Av无码少妇| 无码人妻精品一区二区三区99仓本| 18禁成年无码免费网站无遮挡| 成人免费无码大片A毛片抽搐| 久久精品无码一区二区无码| 免费a级毛片无码a∨免费软件| 亚洲AV无码久久精品成人| 无码任你躁久久久久久久| 九九无码人妻一区二区三区| 一级片无码中文字幕乱伦| 色欲aⅴ亚洲情无码AV蜜桃| 欲色aV无码一区二区人妻| 免费无码A片一区二三区| 高清无码午夜福利在线观看| 久久久久亚洲AV无码专区体验 | 无码午夜人妻一区二区不卡视频 | 中文字幕有码无码AV| 精品国产毛片一区二区无码| yy111111少妇影院无码| 无码日韩精品一区二区人妻| 国产精品无码不卡一区二区三区| 无码日韩精品一区二区人妻| 国产aⅴ无码专区亚洲av麻豆| 久久影院午夜理论片无码| 国产午夜无码片免费|