【技術(shù)實(shí)現(xiàn)步驟摘要】
【技術(shù)保護(hù)點(diǎn)】
一種挖掘事務(wù)數(shù)據(jù)流上最近時(shí)間窗口內(nèi)頻繁模式的方法,其步驟包括:(1)根據(jù)用戶輸入的用戶支持度門限θ與用戶許可誤差ε確定流數(shù)據(jù)窗口大小N與衰減因子f,N=「1/ε」,f等于f↓[1]或f↓[2],其中,***≤f↓[1]≤10<f↓[2]<***式中,用戶支持度門限θ的取值范圍為(0,1),用戶許可誤差ε的取值范圍為(0,θ);(2)選定全序*的排序規(guī)則;(3)開辟頻繁模式樹的存儲(chǔ)區(qū)和流數(shù)據(jù)緩存隊(duì)列的存儲(chǔ)區(qū),并初始化頻繁模式樹與流數(shù)據(jù)緩存隊(duì)列;其中,頻繁模式樹用于動(dòng)態(tài)存儲(chǔ)數(shù)據(jù)流上最近時(shí)間窗口內(nèi)的頻繁模式,頻繁模式樹由模式樹與頻繁數(shù)據(jù)項(xiàng)表兩部分組成;模式樹上每一個(gè)節(jié)點(diǎn)都包括節(jié)點(diǎn)名稱、指向孩子節(jié)點(diǎn)的指針、指向兄弟節(jié)點(diǎn)的指針、活動(dòng)數(shù)據(jù)窗口內(nèi)的支持?jǐn)?shù)、固定數(shù)據(jù)窗口內(nèi)的支持?jǐn)?shù)、包含該節(jié)點(diǎn)的最近事務(wù)ID的節(jié)點(diǎn)時(shí)間戳、指向同名節(jié)點(diǎn)的指針;頻繁數(shù)據(jù)項(xiàng)表中的每一數(shù)據(jù)表項(xiàng)都由數(shù)據(jù)項(xiàng)名稱和指向前綴模式樹上第一個(gè)同名節(jié)點(diǎn)的指針兩個(gè)數(shù)據(jù)域組成;模式樹的每一個(gè)分枝上的節(jié)點(diǎn)及頻繁數(shù)據(jù)項(xiàng)表上的數(shù)據(jù)表項(xiàng)均按照全序*排列;(4)當(dāng)數(shù)據(jù)流連續(xù)到達(dá)時(shí),根據(jù)流數(shù)據(jù)到達(dá)的順序?qū)⑵涮砑拥较到y(tǒng)緩存隊(duì)列中,并根據(jù)流數(shù)據(jù)窗口大小N對(duì)緩存隊(duì) ...
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李國(guó)徽,陳輝,楊兵,陳基雄,
申請(qǐng)(專利權(quán))人:華中科技大學(xué),
類型:發(fā)明
國(guó)別省市:83[]
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。