• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>黃放專利>正文

    xml數據壓縮和解壓方法技術

    技術編號:2872409 閱讀:229 留言:0更新日期:2012-04-11 18:40
    一種xml數據壓縮和解壓方法,包括壓縮過程和解壓縮過程,其特征是:    壓縮過程包括如下步驟:    1)  計算機系統把xml格式的數據代碼中的“數據結構特征”歸納成為xml格式的結構代碼;    2)  計算機系統運行數據壓縮程序,參照結構代碼對數據特征的描述,把xml數據轉換為平文格式的數據代碼;    解壓縮過程中,計算機系統運行解壓縮程序,解析數據代碼,并參照結構代碼對數據特征的描述,恢復源數據的信息。(*該技術在2023年保護過期,可自由使用*)

    【技術實現步驟摘要】

    本專利技術涉及一種。
    技術介紹
    擴展標記語言(Extensible Markup Lange)xml是World Wide WebConsortium(W3C)公布的一種語義標記規則,自從1997年12月發布以來,xml已取得了巨大成功;它被廣泛地按照許多方式應用,其中一些應用正在開始進行,而另一些應用已經有了相當驚人的成果,可以預測xml的作用會越來越重要。由于xml是非專有的并且易于閱讀和編寫,就使得它成為在不同的應用之間交換數據的理想格式。xml數據格式文件可以分為兩個部分,載體和載荷。載體又可以分為兩個部分屬性特征和結構特征。屬性特征在xml數據文件中起著描述、定義數據格式和數據屬性的功能,如數據類型,長度和顯示或打印格式等,結構特征在xml數據文件中描述數據的結構形式和數據之間的關系。剩余部分則是有效數據載荷。xml語言作為一種數據載體的格式規范存在一個明顯的缺點就是載體部分往往占據了整個數據文件的較大部分,而且,通常載體部分大于載荷(數據)的部分。例如用xml對“鐵”的比重的描述可以如下Script 1&lt;OBJECT name=”iron”&gt; &lt;specific_gravitytype=”number”1ength=”4”unit=”g/cube cm”&gt;7.86&lt;specific_gravity/&gt; &lt;/OBJECT&gt;(119個字符)可解析為物體“鐵”的比重為7.86,計量單位為“克/立方厘米”,有效數據長度為4,數據類型為數字。其中,有效數據為iron,7.86(8個字符,不包含分隔符)。其余部分(111個字符)都是按照格式規范要求和應用需要對相應數據的描述或定義,載體使得處理該數據的計算機程序或閱讀者可以理解數據的含義,從而實現和簡化計算機自動處理數據的功能,或實現xml數據的可閱讀功能。因此,如果忽略數據載體的部分,數據本身的含義就會消失而使數據變得沒有意義,或者說不可解析。然而,如果按照以上的格式,描述100種不同物質的比重,數據載體部分將大量重復出現(為11100個字符)。占據了數據文件的大部分存儲空間和傳輸空間。xml數據壓縮算法的目標就是希望壓縮數據載體的尺寸。對上述數據格式,我們可以用xml的一個特殊xml文件,“大綱”(xml Schema)歸納其載體部分為不重復的內容Script 2&lt;Element name=”OBJECT”&gt; &lt;Attribute name=”name”type=”string”/&gt; &lt;Element name=”specific_gravity”&gt; &lt;Attribute name=”type”type=”string”/&gt; &lt;Attribute name=”length”type=”number”length=”4”/&gt; &lt;Attribute name=”unit”type=”string”/&gt; &lt;/Element&gt; &lt;/Element&gt; Script 2歸納了Script 1的結構特征和屬性特征,而與具體的數據值沒有關系。根據Script 2的歸納,Script l可以改寫為Script 3&lt;OBJECT name=”iron”&gt; &lt;specific_gravity&gt;7.86&lt;specific_gravity/&gt; &lt;/OBJECT&gt; 在Script 3中去掉了specific_gravity的屬性內容,即把載體中對數據屬性的描述歸納到了大綱文件中,使得文件的尺寸減小。利用現有的xml技術,可以從大綱Script 2中檢索到specific_gravity的屬性,從而保持了信息的完整性。但是,與載荷的尺寸(8個字符)相比,Script 3的尺寸仍然很大,這是因為雖然在Script 2包含了Script 1的數據結構規則,但是在xml數據文件中,仍然必須通過使用xml的語法去實現數據結構的具體形式。也就是說用xml的語法規則和Schema技術,無法有效地減小xml數據文件中載體的結構的大小。
    技術實現思路
    本專利技術的目的就是為了解決以上問題,提供一種,有效地減小xml數據文件中載體的結構的大小。為實現上述目的,本專利技術提出一種,包括壓縮過程和解壓縮過程,其特征是壓縮過程包括如下步驟1)計算機系統把xml格式的數據代碼中的“數據結構特征”歸納成為xml格式的結構代碼;2)計算機系統運行數據壓縮程序,把xml數據轉換為平文格式的數據代碼;解壓縮過程中,計算機系統運行解壓縮程序,解析數據代碼,并參照結構代碼對數據特征的描述,恢復源數據的信息。由于采用了以上的方案,把xml數據轉換為平文格式的數據代碼,這種數據格式的有效載荷比例增大了許多,數據得到壓縮。只要把壓縮后的平文格式數據中的各項數據與結構代碼對數據特征的描述聯系起來,我們就可以把它們恢復成原來的xml數據格式。如果原始文件中包含了大量的數據,顯而易見,把文件轉換成結構代碼+平文格式數據的格式進行存儲和傳輸,將能大大地壓縮數據的存儲空間和傳輸空間。附圖說明圖1是本專利技術實施例結構代碼生成流程示意圖。圖2是本專利技術實施例壓縮代碼生成流程示意圖。圖3是本專利技術實施例數據壓縮流程示意圖。圖4是本專利技術實施例數據解壓縮流程示意圖。圖5本專利技術實施例擴充功能流程示意圖。具體實施例方式下面通過具體的實施例并結合附圖對本專利技術作進一步詳細的描述。仍以前文中對鐵的比重是的描述為例,如果把載荷(數據)部分轉換成用約定分隔符分割數據的平文格式Script 4OBJECT,water+1OBJECT,iron+7.86OBJECT,lead+11.34... OBJECT,copper+8.96這種數據格式的有效載荷比例增大了許多,數據得到壓縮。如果把Script 4中的各項數據與大綱文件Script 2中的相應節點用某種方法聯系起來,我們就可以獲得Script 4內各項數據的有關特征,并把它們恢復成原來的xml數據格式。如果Script 1包含了大量的數據,顯而易見,把它轉換成Script 2+Script 4的格式進行存儲和傳輸,將能大大地壓縮數據的存儲空間和傳輸空間。本專利技術就提供了這樣一種方法。本方法在數據壓縮時,把xml格式的數據代碼中的“數據結構特征”歸納成為xml格式的結構代碼。利用結構代碼,計算機系統可以運行通用的壓縮代碼生成程序,動態地生成壓縮程序。計算機系統運行數據壓縮程序,把xml數據轉換為平文格式的數據代碼。數據解壓縮時,計算機系統運行解壓縮程序,解析數據代碼,并參照結構代碼對數據特征的描述,恢復源數據的信息。通過應用這種技術在保存數據完整信息的同時減小數據存儲和傳輸的大小。其中,壓縮程序的生成也可采用其他方式,如通過編程生成通用的壓縮程序本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】

    【專利技術屬性】
    技術研發人員:黃放
    申請(專利權)人:黃放
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码精品A∨在线观看| 人妻无码αv中文字幕久久琪琪布| 无码粉嫩小泬无套在线观看| 无码夫の前で人妻を犯す中字| 激情射精爆插热吻无码视频| 亚洲一区AV无码少妇电影☆| 无码射肉在线播放视频| 国产精品无码A∨精品影院| 最新无码专区视频在线| 亚洲中文字幕久久精品无码喷水| 无码人妻啪啪一区二区| 人妻无码久久一区二区三区免费| 狠狠噜天天噜日日噜无码| 国产乱人伦中文无无码视频试看| 亚洲精品无码午夜福利中文字幕 | 亚洲va无码手机在线电影| 免费a级毛片无码a∨性按摩| 成人免费午夜无码视频| 亚洲av永久无码精品漫画| 亚洲中文字幕无码一区二区三区| 爽到高潮无码视频在线观看| 免费无码又爽又刺激毛片| 无码乱肉视频免费大全合集| 亚洲日韩乱码中文无码蜜桃| 无码国内精品人妻少妇| 亚洲AV无码国产精品麻豆天美| 中文字幕无码毛片免费看| 精品无码国产自产拍在线观看蜜| 国产精品成人无码免费| 免费无码不卡视频在线观看| 国产精品无码一区二区三区在 | 韩日美无码精品无码| 日韩AV片无码一区二区不卡| 国产免费av片在线无码免费看| 人妻aⅴ中文字幕无码| 国产怡春院无码一区二区| 免费无码婬片aaa直播表情| 无码办公室丝袜OL中文字幕| 国产成年无码v片在线| yy111111少妇影院里无码| 无码av中文一二三区|