• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于聚類的非一致性數據庫查詢方法技術

    技術編號:9718868 閱讀:155 留言:0更新日期:2014-02-27 05:40
    本發明專利技術涉及一種基于聚類的非一致性數據庫查詢方法,屬于數據庫查詢技術領域。具體包括:(1)多個關系的可信聚類概率的查詢重寫算法;(2)無連接聚集查詢重寫算法;(3)基于聚類的有連接聚集查詢重寫算法。本發明專利技術以元組匹配所產生的聚類和元組概率為基礎,提出了可信聚類概念和基于概率方法的非一致性數據庫查詢重寫方法。查詢重寫縮小了結果集中的可信聚類數量,有效地提高了查詢性能。此基礎上擴展了基于概率方法的聚集查詢重寫,不但考慮連接查詢,而且考慮聚集分組SPJ查詢。

    【技術實現步驟摘要】

    本專利技術涉及一種,屬于數據庫查詢

    技術介紹
    聚類方法把數據集合分成若干類,使得每個類內部的數據盡量相似,而屬于不同類的數據盡量不同。現實世界中,有ー種不確定信息,信息不精確。在處理不確定性信息方面,經典關系數據庫處理不了具有不精確的數據,因而概率數據模型擴展了關系數據模型,對數據的不確定性進行了度量,在數據庫的關系中引入概率屬性來表示該元組的不確定性。對于實體對應的多個元組而言,每個元組的屬性值是不確定的,表示實體的概率大小。基于聚類的概念,聚類內多個潛在的非一致性元組可以給定概率,假定ー個聚類代表ー個現實實體,聚類內的姆個元組表示實體的概率和為I,認為是元組在聚類內概率是條件獨立的,在不同聚類之間概率是獨立的;并提出了一種候選數據庫概念,對聚類概率進行計算和評價,但考慮的候選數據庫對于實際的海量數據庫來說是不可行的,且沒有考慮查詢重寫。
    技術實現思路
    本專利技術的目的在于提供一種,以便縮小結果集中的可信聚類數量,有效地提高查詢性能。為了實現上述目的,本專利技術的技術方案如下。一種,具體包括: (I)多個關系的可信聚類概率的查詢重寫算法,詳細的步驟如下: (Ia)在給定的ー個SPJ查詢中,首先得到查詢中的關系個數t和選擇條件個數I初始化重寫查詢皮/。外循環次數為關系個數,內循環為選擇條件個數。在外循環中,取得臨時變量存儲產生結果集的別名filter,初始化非連接合取謂詞集和連接合取謂詞屬性集AJ; (Ib)在第I個內循環中,如果合取選擇謂詞中的屬性是關系中的屬性,則判斷是否為連接的。如果為非連接合取謂詞,則把合取選擇謂詞中的屬性加入到非連接合取謂詞屬性集中,否則加入到連接合取謂詞屬性集中; (Ic)在第2個內循環中,如果合取選擇謂詞中的屬性是查詢中投影屬性,把合取選擇謂詞中的屬性加入到連接合取謂詞屬性集中; (Id)在外循環的最后取得該次循環產生的過濾查詢ガブ。連接合取謂詞屬性集5^ゾ等于合取謂詞屬性集減去非連接合取謂詞屬性集SCW ; (Ie)通過已經取得的產生過濾查詢ガブ、連接合取謂詞屬性集5Tゾ和結果集別名最終輸出查詢重寫語句。注意到沒有加入非連接合取謂詞屬性集5tF,這是因為在產生過濾查詢ノび時,就已經對本次循環的關系進行了非連接合取謂詞過濾元組,這樣壓縮了需要連接結果集的元組,在最后的結果集進行連接時,有助于提高查詢性能。(2)無連接聚集查詢重寫算法,具體算法的基本步驟如下: (2a)首先對初始分組屬性G和聚類屬性cluster進行分組求聚集屬性的最大值、最小值以及期望值和,得到結果集^/7ゴ; (2b)如果同一聚類內分組屬性值不相同,則最小值為0,因此需要去掉這種情況的元組,在產生的結果集cmd上對初始分組屬性G進行分組求最小值和,得到包含最小值的結果集min_cand ; (2c )在結果集cmd上對初始分組屬性G進行分組求最大值和期望值和,得到包含最大值和期望值的結果集max_ cand ; (2d)在外查詢中,對已經產生的包含最大值和期望值的結果集左連接到包含最小值的的結果集如果連接得到最小值為空,則最小值為O。最終產生初始分組屬性G的最值和期望值。(3)基于聚類的有連接聚集查詢重寫算法,基本步驟如下: (3a)首先初始化重寫查詢,取得SPJ聚集查詢的關系集合/?的元素個數、分組屬性集合G的元素個數、選擇謂詞集合5T的元素個數和聚集屬性集合A的元素個數; (3b)以關系集合/?的元素個數為外循環次數,以選擇謂詞集合5T的元素個數為內循環次數。在內循環中,如果條件謂詞為關系的連接合取選擇謂詞,則過濾連接值不一致的聚類,取得該次循環中基于連接謂詞的查詢過濾子結果集; (3c)然后再次以關系集合/?的元素個數為外循環次數,初始化結果集標記分組屬性集從、聚集值屬性集メ萬、非連接合取選擇謂詞集和非連接合取選擇謂詞集SCJ。在第I個內循環中,以聚集屬性集合A的元素個數為內循環次數,如果聚集值屬性在該次循環的關系中,聚集值屬性加入到聚集值屬性集W?。在第2個內循環中,以分組屬性集合G的元素個數為內循環次數,如果分組屬性在該次循環的關系中,分組屬性加入到分組屬性集d第3個內循環中,以選擇謂詞集合5T的元素個數為內循環次數,如果連接屬性在該次循環的關系中,且選擇謂詞為連接合取選擇謂詞,則選擇謂詞的連接屬性加入到分組屬性集;如果連接屬性在該次循環的關系中,且選擇謂詞為非連接合取選擇謂詞,則選擇謂詞的連接屬性加入到非連接選擇謂詞集。在外循環中,取得本次循環根據非連接選擇謂詞集和聚類存在于候選集的條件,對聚類屬性和分組屬性集分組取得概率與聚集屬性和的過濾結果集;然后連接選擇謂詞集5Tゾ為減去本次循環的非連接選擇謂詞; (3d)在外查詢中,基于上ー步產生的過濾結果集進行連接,以連接選擇謂詞為條件,對分組屬性集進行分組聚集求聚集屬性的最小值的結果集;基于初始查詢,加入聚類屬性,對聚集屬性求最大值和期望值的候選結果集;再對最大值和期望值的候選結果集左連接最小值的結果集,取得初始查詢按照分組屬性集的最大值、最小值和期望值的重寫語句。該專利技術的有益效果在于:本專利技術以元組匹配所產生的聚類和元組概率為基礎,提出了可信聚類概念和基于概率方法的非一致性數據庫查詢重寫方法。查詢重寫縮小了結果集中的可信聚類數量,有效地提高了查詢性能。此基礎上擴展了基于概率方法的聚集查詢重寫,不但考慮連接查詢,而且考慮聚集分組SPJ查詢。【附圖說明】圖1是本專利技術實施例中基于聚類的標記圖。圖2是本專利技術實施例中基于聚類的無連接查詢重寫算法截圖。【具體實施方式】下面結合附圖和實施例對本專利技術的【具體實施方式】進行描述,以便更好地理解本專利技術。實施例 基于聚類的非一致性數據庫查詢是基于連接圖的概念。為了更好地區分關系的聚類、連接屬性、鍵屬性和合取選擇謂詞中的屬性,直觀地表示SPJ查詢,本專利技術給出了基于聚類的標記圖定義。定義1:設^是ー個合取查詢,如果它的連接圖G是ー個標記圖,那么^中的屬性表不方式為:(a)如果是鍵屬性,則表不為f ;如果鍵屬性是連接屬性,表不為(b)如果是非鍵屬性,表示為メ ;如果這個非鍵屬性是連接屬性,則表示為W ; (C)如果非鍵屬性是合取謂詞選擇條件中的屬性,則表示為抑;(d)聚類屬性cluster表示同一實體。定義2:設ヴ是ー個合取查詢,它的連接圖是以K,萬〉,如果ヴ的圖采用標記屬性來表示邊和節點,則7的連接圖是基于聚類的標記圖。如果7是采用標記屬性來表示,則是基于聚類的標記查詢。q的基于聚類的標記圖可以表示為圖1。基于上述定義,本專利技術實施例中的,具體包括: (I)多個關系的可信聚類概率的查詢重寫算法,其詳細的步驟如下: (Ia)在給定的ー個SPJ查詢中,首先得到查詢中的關系個數t和選擇條件個數I初始化重寫查詢皮/。外循環次數為關系個數,內循環為選擇條件個數。在外循環中,取得臨時變量存儲產生結果集的別名filter,初始化非連接合取謂詞集和連接合取謂詞屬性集AJ; (Ib)在第I個內循環中,如果合取選擇謂詞中的屬性是關系中的屬性,則判斷是否為連接的。如果為非連接合取謂詞,則把合取選擇謂詞中的屬性加入到非連接合取謂詞屬性集中,否則加入到連接合取謂詞屬性集中; (Ic)在第本文檔來自技高網...

    【技術保護點】
    一種基于聚類的非一致性數據庫查詢方法,其特征在于:具體包括:?(1)多個關系的可信聚類概率的查詢重寫算法,詳細的步驟如下:(1a)在給定的一個SPJ查詢中,首先得到查詢中的關系個數t和選擇條件個數k,初始化重寫查詢RJ;外循環次數為關系個數,內循環為選擇條件個數;在外循環中,取得臨時變量存儲產生結果集的別名filter,初始化非連接合取謂詞集SCW和連接合取謂詞屬性集AJ;(1b)在第1個內循環中,如果合取選擇謂詞中的屬性是關系中的屬性,則判斷是否為連接的;如果為非連接合取謂詞,則把合取選擇謂詞中的屬性加入到非連接合取謂詞屬性集SCW中,否則加入到連接合取謂詞屬性集AJ中;(1c)在第2個內循環中,如果合取選擇謂詞中的屬性是查詢中投影屬性,把合取選擇謂詞中的屬性加入到連接合取謂詞屬性集AJ中;(1d)在外循環的最后取得該次循環產生的過濾查詢RJ;連接合取謂詞屬性集SCJ等于合取謂詞屬性集減去非連接合取謂詞屬性集SCW;(1e)通過已經取得的產生過濾查詢RJ、連接合取謂詞屬性集SCJ和結果集別名filter,最終輸出查詢重寫語句;(2)無連接聚集查詢重寫算法,具體算法的基本步驟如下:(2a)首先對初始分組屬性G和聚類屬性cluster進行分組求聚集屬性的最大值、最小值以及期望值和,得到結果集cand;(2b)如果同一聚類內分組屬性值不相同,則最小值為0,因此需要去掉這種情況的元組,在產生的結果集cand上對初始分組屬性G進行分組求最小值和,得到包含最小值的結果集min_cand;(2c)在結果集cand上對初始分組屬性G進行分組求最大值和期望值和,得到包含最大值和期望值的結果集max_cand;(2d)在外查詢中,對已經產生的包含最大值和期望值的結果集max_cand左連接到包含最小值的的結果集min_cand;如果連接得到最小值為空,則最小值為0;最終產生初始分組屬性G的最值和期望值;?????(3)基于聚類的有連接聚集查詢重寫算法,基本步驟如下:(3a)首先初始化重寫查詢,取得SPJ聚集查詢的關系集合R的元素個數、分組屬性集合G的元素個數、選擇謂詞集合SC的元素個數和聚集屬性集合E的元素個數;(3b)以關系集合R的元素個數為外循環次數,以選擇謂詞集合SC的元素個數為內循環次數;在內循環中,如果條件謂詞為關系的連接合取選擇謂詞,則過濾連接值不一致的聚類,取得該次循環中基于連接謂詞的查詢過濾子結果集;(3c)然后再次以關系集合R的元素個數為外循環次數,初始化結果集標記filter、分組屬性集GR、聚集值屬性集AE、非連接合取選擇謂詞集SCW和非連接合取選擇謂詞集SCJ;在第1個內循環中,以聚集屬性集合E的元素個數為內循環次數,如果聚集值屬性在該次循環的關系中,聚集值屬性加入到聚集值屬性集AE;在第2個內循環中,以分組屬性集合G的元素個數為內循環次數,如果分組屬性在該次循環的關系中,分組屬性加入到分組屬性集GR;第3個內循環中,以選擇謂詞集合SC的元素個數為內循環次數,如果連接屬性在該次循環的關系中,且選擇謂詞為連接合取選擇謂詞,則選擇謂詞的連接屬性加入到分組屬性集;如果連接屬性在該次循環的關系中,且選擇謂詞為非連接合取選擇謂詞,則選擇謂詞的連接屬性加入到非連接選擇謂詞集;在外循環中,取得本次循環根據非連接選擇謂詞集和聚類存在于候選集的條件,對聚類屬性和分組屬性集分組取得概率與聚集屬性和的過濾結果集;然后連接選擇謂詞集SCJ為減去本次循環的非連接選擇謂詞;(3d)在外查詢中,基于上一步產生的過濾結果集進行連接,以連接選擇謂詞為條件,對分組屬性集進行分組聚集求聚集屬性的最小值的結果集;基于初始查詢,加入聚類屬性,對聚集屬性求最大值和期望值的候選結果集;再對最大值和期望值的候選結果集左連接最小值的結果集,取得初始查詢按照分組屬性集的最大值、最小值和期望值的重寫語句。...

    【技術特征摘要】
    1.一種基于聚類的非一致性數據庫查詢方法,其特征在于:具體包括: (1)多個關系的可信聚類概率的查詢重寫算法,詳細的步驟如下: (Ia)在給定的ー個SPJ查詢中,首先得到查詢中的關系個數t和選擇條件個數I初始化重寫查詢皮/;外循環次數為關系個數,內循環為選擇條件個數;在外循環中,取得臨時變量存儲產生結果集的別名filter,初始化非連接合取謂詞集和連接合取謂詞屬性集AJ; (Ib)在第I個內循環中,如果合取選擇謂詞中的屬性是關系中的屬性,則判斷是否為連接的;如果為非連接合取謂詞,則把合取選擇謂詞中的屬性加入到非連接合取謂詞屬性集中,否則加入到連接合取謂詞屬性集中; (Ic)在第2個內循環中,如果合取選擇謂詞中的屬性是查詢中投影屬性,把合取選擇謂詞中的屬性加入到連接合取謂詞屬性集中; (Id)在外循環的最后取得該次循環產生的過濾查詢ガブ;連接合取謂詞屬性集5Tゾ等于合取謂詞屬性集減去非連接合取謂詞屬性集SCW ; (Ie)通過已經取得的產生過濾查詢ガブ、連接合取謂詞屬性集5Tゾ和結果集別名A7 ter,最終輸出查詢重寫語句; (2)無連接聚集查詢重寫算法,具體算法的基本步驟如下: (2a)首先對初始分組屬性G和聚類屬性cluster進行分組求聚集屬性的最大值、最小值以及期望值和,得到結果集^/7ゴ; (2b)如果同一聚類內 分組屬性值不相同,則最小值為O,因此需要去掉這種情況的元組,在產生的結果集cmd上對初始分組屬性G進行分組求最小值和,得到包含最小值的結果集min_cand ; (2c )在結果集cmd上對初始分組屬性G進行分組求最大值和期望值和,得到包含最大值和期望值的結果集max_ cand ; (2d)在外查詢中,對已經產生的包含最大值和期望值的結果集左連接到包含最小值的的結果集;如果連接得到最小值為空,則最小值為O ;最終產生初始分組屬性G的最值...

    【專利技術屬性】
    技術研發人員:不公告發明人
    申請(專利權)人:湖南人文科技學院
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久青青草原亚洲av无码app| 无码人妻一区二区三区一| 狠狠精品干练久久久无码中文字幕| 国产成年无码久久久久下载| 国产亚洲?V无码?V男人的天堂 | 无码精品日韩中文字幕| 少妇人妻偷人精品无码AV| 丰满熟妇人妻Av无码区| 亚洲AV无码乱码在线观看牲色| 18禁无遮挡无码国产免费网站| 西西4444www大胆无码| 亚洲av无码专区首页| 无码国产精品一区二区免费16| 亚洲va中文字幕无码| 日韩AV无码久久一区二区| 亚洲熟妇无码AV在线播放| 精品无码中出一区二区| 亚洲av成人无码网站…| 亚洲熟妇av午夜无码不卡| 无码少妇一区二区三区| 亚洲gv猛男gv无码男同短文 | 无码人妻少妇久久中文字幕| 无码一区二区三区AV免费| 亚洲熟妇av午夜无码不卡| 中日韩亚洲人成无码网站| 人妻丰满av无码中文字幕| 欧洲精品久久久av无码电影| 亚洲AV中文无码字幕色三| 亚洲乱亚洲乱妇无码麻豆| 亚洲精品~无码抽插| 中文有码vs无码人妻| 亚洲AV永久无码精品| 亚洲AV无码一区二区二三区入口| 夜夜添无码试看一区二区三区 | 中文字幕日产无码| 亚洲精品中文字幕无码A片老| 亚洲国产AV无码一区二区三区| 亚洲av无码专区在线电影| 狼人无码精华AV午夜精品| 亚洲伊人成无码综合网| 日韩经典精品无码一区|