本發明專利技術涉及數據庫內存儲數據信息的一種結構,在該種結構內數據信息以節點層次結構組織,該層次結構由樹結構組成。該樹結構包括一個根節點(1),可能的一個或多個中間節點(2,3),和一個或者多個葉節點(4),其中根節點(1)包括一個或多個根元素(1E),各中間節點(2,3)包括一個或者多個中間元素(2E1,2E2,2E3,…),各葉節點(4)包括一個或者多個葉元素(4E1,4E2,4E3,…)。各元素包括保持該樹結構在一起所必需的、和能在該樹和數據信息中執行搜索的地址信息。一個節點內的元素的順序是關于數據信息的邏輯順序,諸如數字或字母順序,這里各元素中的數據信息組成相對于在該層次結構中前一元素內的數據信息的數據信息差。在根元素內的數據信息組成一個開始值。該開始值是實際數據信息,其余元素內的差信息由表示相對于屬于前一元素的數據信息的數據信息的實際差的數據字組成,而不管該差位于所述數據信息內的什么位置。(*該技術在2018年保護過期,可自由使用*)
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及在數據庫內存儲數據信息的結構。當數據信息以,形成B樹的節點層次組織時其結構是適宜的。這種樹包括根節點,可能有一層或者多層中間節點,和一個或者多個葉節點。根節點包括根元素,各中間節點分別包括一個或者多個中間元素,而各葉節點分別包括一個或者多個葉元素。通過把一個中間節點內的第一中間元素與根元素、或與位于該層次結構中較高級的一個中間節點內的中間元素連接而構造B樹。在該中間節點內的其余中間元素連接到該第一中間元素。類似地,各葉節點內的第一葉元素要么連接到根元素,要么連接到一個中間節點的中間元素。葉節點內的其余葉元素連接到該第一葉元素。各元素包括該連接的地址信息和數據信息。在一個節點內的元素的順序是相對于數據信息的邏輯順序,諸如字母或數字順序。各元素中的數據信息組成相對于屬于在層次結構中前一元素的數據信息的數據信息差。很久以來就知道使用不同數據結構在數據庫中存儲數據。這些結構例如在所用存儲空間和快速檢索的可能性方面具有各種優點。一種已知的結構基于B樹,以之能使元素邏輯分布在數據庫內的一個表中。一個元素可以包括數據庫內連接到一個外部鍵字例如一個電話號碼的一個內部地址。當在表內插入一個新電話號碼時,通過邏輯順序計算將放置該電話號碼的內部地址的元素。B樹的功能是在表中分布地址,使得所述地址以易于找到的方式分布。使用B樹主要建立順序和簡單的結構。每一樹以一個根節點開始,它指向另外的節點,在這另外的節點中可以基于某種判據檢索希望的節點。這些節點常常包括一個鍵字或一個索引。Http地址、文件名、時間印記、電話號碼等都是存儲在B樹中的鍵字的例子。還應該提到,前述節點是在意在說明存儲鍵字或索引的層次結構的樹結構中的節點,而不是在分布式數據庫中的處理器節點。還公知在邏輯順序數據集合的場合只存儲兩個相互順序數據集合之間的差信息。例如,在圖象處理中使用這一過程,此時需要存儲大量信息和重放運動圖片或圖象,但是在相互順序的圖象之間的差別可以非常小,因此只存儲這些圖象之間的差別和在重放時使用這些差別。還公知結合鏈接表,只存儲兩個互連元素之間的差別而不存儲整個元素。這需要較少存儲空間,但是提供同樣的信息。還應該提到,結合例如文件名或http地址,使用不同的格式或后綴,這些可能使以簡單方式說明在兩個相鄰節點之間的差信息變得困難。下面的出版物說明以B樹構造的信息的處理。J.Gray,A.Reuter,所著“事務處理概念和技術”,1993年,Morgen Kaufman出版社。R.Bayer,K.Unterauer發表的“前綴B樹”,關于數據庫的ACM學報,1977年,第二卷,第一期,11-26頁。還應該提到,公知在所謂的容器(container)中存儲不同元素,在容器中元素彼此順序相連,且容器可視為單元對待。當考慮上述現有技術的狀態時,可以看到,一個技術問題在于,通過只存儲相對于先前節點的差信息,提供一種在數據庫中存儲數據信息的結構,該種結構比公知結構需要的存儲空間少得多,即使是對公知的壓縮。另一技術問題存在于提供易于高效找到希望的元素或對象的壓縮結構。另一技術問題在于提供一種結構的能力,在該種結構中數據字能以明確而簡單的方式說明出現的差別。再一技術問題在于提供數據字的結構,它以簡單方式處理要存儲的數據信息的不同后綴。另一技術問題在于,當所述差不在數據信息的末尾時能夠容易地表示兩組數據信息之間的差,而不需要表示在數據信息中這一差別后面找到的相似性便能容易地表示。另一技術問題在于處理壓縮B樹中的元素或對象的改變。再一技術問題是能使壓縮B樹中的元素或對象被復制。另一技術問題是當尋找一特定元素時加速B樹的搜索。另一技術問題是提供一種結構,在該種結構中當尋找一特定元素時數據信息的壓縮提供本質上加速搜索B樹的可能性。再一技術問題是提供一種結構,它能使B樹中的元素的插入和清除容易和高效,其中數據信息是被壓縮的,且只包括涉及先前節點的差信息。另一技術問題是提供一種結構,從而可通過讀入超高速緩沖存儲器而使包括多個元素的一個節點可供使用。另一技術問題是提供一種結構,在該種結構中,參考不同節點和在其中包括的元素需要的地址信息量比常規上需要的少得多。旨在解決上述一個或多個技術問題,并以在引言中所述結構作為開始點,本專利技術建議,根元素內的數據信息構成開始值,并且該開始值構成實際數據信息。還建議,其余元素內的差信息包括一個數據字,它表示相對于先前元素的數據信息的數據信息的實際差,不管該差在數據信息內的什么位置。由于只存儲實際差,不管該差是否在末尾,因此可以得到高度壓縮結構。根據本專利技術的一個實施例,通過允許差信息包括某種指令建立這種結構,這種指令例如為是否某些相對于前一元素的數據信息要被清除,和如果是的話,要去掉的東西的性質和在數據信息中的什么地方去掉,以及允許差信息包括某種指令,這種指令例如為相對于屬于前一元素的數據信息是否要添加的東西的性質,如果是的話,要添加的東西的性質和在要進行這一添加的數據信息中的什么地方添加。為提供表示差信息的壓縮的或緊湊的方式,本專利技術建議,數據字包括頭標和信息部分,其中頭標表示信息部分應如何被解釋。還建議,信息部分可以包括5個不同的位組,其中-第一組,它在本文件中稱為后綴,它表示屬于該數據信息的后綴類型;-第二組,它在本文件中稱為減信息,它表示相對于前一元素要去掉的字節數目;-第三組,它在本文件中稱為加信息,它表示相對于前一元素要加上的字節數目;-第四組,它在本文件中稱為相似性,它表示除后綴外,從末尾開始相似于前一元素的字節數目;-第五組,它在本文件中是指定的差,它組成由明文表示的要添加的字符,亦即加信息。為能夠正確解釋前述各組,建議頭標由3位組成-第一位表示第四組是否存在,亦即表示差是否存在于數據信息末尾;-第二位表示第二和第三組是包括4位還是8位;-第三位表示第二、第三和第五組是否存在,亦即在后綴外是否發現任何差信息。這樣,提供了一種結構,其中第一組包括5位,第二組和第三組包括4或8位,第四組包括0或8位,第五組包括表示相對于前一元素要添加的任何信息所需要的字節數目。因此,除第五組外,當只在后綴中存在差時,所有差信息可以至少用8位,亦即1字節表示;或當所有組包括最大位數時,最多用32位,亦即4字節。當其由加信息組成時,1到4字節,加上實際差,這相對于公知技術來說是顯著的壓縮。這一數量的信息需要相應于無壓縮所需要的存儲空間的20%。通過5位的介質,第一組能夠表示一個預定后綴表的32種不同的后綴,這將允許處理大量的后綴,而每一后綴可以只用5位表示。在各葉元素中的數據信息還包括尋找的對象。為處理一個對象是某事務處理的主體時的對象鎖定,本專利技術建議,各對象包括4個不同的位組合,其中第一位組合表示該對象是否鎖定。當第一位組合表示一個對象未鎖定時,第二位組合組成對象狀態位,第三位組合包括有關屬于一個對象的對象鍵字長度的信息,而第四位組合包括該對象鍵字。當第一位組合表示該對象被鎖定時,屬于其余位組合的位表示對一個事務處理寄存器的參考。該事務處理寄存器包括對象狀態位,有關屬于所述對象的一個對象鍵字的長度的信息,該對象鍵字自身,有關施加在該對象上的鎖的類型的信息。狀態位用于對象復制過程,此時各位指示該對象是否已經被復制。多個同本文檔來自技高網...
【技術保護點】
數據庫內存儲數據信息的一種結構,在該種結構內數據信息以包含樹結構的節點層次組織,該樹結構包括根節點,可能的一層或者多層中間節點,和一個或者多個葉節點,其中根節點包括一個或多個根元素,各中間節點包括一個或者多個中間元素,各葉節點包括一個或者多個葉元素,其中,在中間節點內的第一中間元素連接到根元素或連接到位于該層次結構中較高一級的中間節點內的中間元素,其中,在該中間節點內的其余中間元素連接到所述第一中間元素,其中,各葉節點內的第一葉元素要么連接到根元素,要么連接到中間節點之一的一個中間元素,葉節點內的其余葉元素連接到第一葉元素,其中,各元素包括用于連接的地址信息和數據信息,這里在節點內的元素的順序相對于數據信息是邏輯順序,諸如字母或數字順序,這里各元素中的數據信息組成相對于屬于在該層次結構中前一元素的數據信息的數據信息的差,其特征在于,在所述根元素內的數據信息組成一個開始值;所述開始值包含實際數據信息;其余元素內的差信息包括表示相對于屬于前一元素的數據信息的數據信息的實際差,而不管該差位于所述數據信息內的什么位置。
【技術特征摘要】
【國外來華專利技術】...
【專利技術屬性】
技術研發人員:UM隆斯特倫,
申請(專利權)人:艾利森電話股份有限公司,
類型:發明
國別省市:SE[瑞典]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。