【技術(shù)實現(xiàn)步驟摘要】
數(shù)據(jù)庫數(shù)據(jù)的分析方法、設(shè)備、系統(tǒng)及存儲介質(zhì)
本申請涉及數(shù)據(jù)庫
,尤其涉及一種數(shù)據(jù)庫數(shù)據(jù)的分析方法、設(shè)備、系統(tǒng)及存儲介質(zhì)。
技術(shù)介紹
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)據(jù)庫的應(yīng)用越來越廣泛。在實際應(yīng)用中,數(shù)據(jù)庫經(jīng)常面臨各種數(shù)據(jù)分析需求。為了減輕數(shù)據(jù)庫的負(fù)擔(dān),一般是按照一定的備份策略將數(shù)據(jù)庫中的數(shù)據(jù)全量備份至數(shù)據(jù)倉庫中,然后在數(shù)據(jù)倉庫中利用備份的全量數(shù)據(jù)進(jìn)行分析。這種利用數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)分析方式可降低數(shù)據(jù)庫的負(fù)擔(dān),但是在面對不斷多樣化的數(shù)據(jù)分析需求時仍有一定不足,有待提供一種新的數(shù)據(jù)分析方法。
技術(shù)實現(xiàn)思路
本申請的多個方面提供一種數(shù)據(jù)庫數(shù)據(jù)的分析方法、設(shè)備、系統(tǒng)及存儲介質(zhì),用以提高數(shù)據(jù)庫數(shù)據(jù)分析的靈活性,滿足多樣化的數(shù)據(jù)分析需求。本申請實施例提供一種數(shù)據(jù)庫數(shù)據(jù)的分析方法,包括:根據(jù)數(shù)據(jù)分析需求,獲取第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志;對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和所述第二時段內(nèi)的數(shù)據(jù)庫增量日志進(jìn)行聯(lián)合分析。本申請實施例還提供一種數(shù)據(jù)分析設(shè)備,包括:存儲器和處理器;所述存儲器,用于存儲計算機(jī)程序;所述處理器,與所述存儲器耦合,用于執(zhí)行所述計算機(jī)程序,以用于:根據(jù)數(shù)據(jù)分析需求,獲取第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志,并對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和所述第二時段內(nèi)的數(shù)據(jù)庫增量日志進(jìn)行聯(lián)合分析。本申請實施例還提供一種數(shù)據(jù)分析系統(tǒng),包括:數(shù)據(jù)分析設(shè)備和數(shù)據(jù)庫;所述數(shù)據(jù)庫,用于產(chǎn)生數(shù)據(jù)庫數(shù)據(jù)和數(shù)據(jù)庫增量日志;所述數(shù)據(jù)分析設(shè)備,用于根據(jù)數(shù)據(jù)分析需求,獲取第一時段
【技術(shù)保護(hù)點】
1.一種數(shù)據(jù)庫數(shù)據(jù)的分析方法,其特征在于,包括:/n根據(jù)數(shù)據(jù)分析需求,獲取第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志;/n對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和所述第二時段內(nèi)的數(shù)據(jù)庫增量日志進(jìn)行聯(lián)合分析。/n
【技術(shù)特征摘要】
1.一種數(shù)據(jù)庫數(shù)據(jù)的分析方法,其特征在于,包括:
根據(jù)數(shù)據(jù)分析需求,獲取第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志;
對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和所述第二時段內(nèi)的數(shù)據(jù)庫增量日志進(jìn)行聯(lián)合分析。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)數(shù)據(jù)分析需求,獲取第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志,包括:
根據(jù)數(shù)據(jù)分析需求,從數(shù)據(jù)庫之外的存儲系統(tǒng)中獲取所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和所述第二時段內(nèi)的數(shù)據(jù)庫增量日志;
其中,所述第一時段內(nèi)的數(shù)據(jù)庫全量數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志產(chǎn)生于所述數(shù)據(jù)庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)數(shù)據(jù)分析需求,從數(shù)據(jù)庫之外的存儲系統(tǒng)中獲取所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和第二時段內(nèi)的數(shù)據(jù)庫增量日志,包括:
根據(jù)包含所述數(shù)據(jù)分析需求中的數(shù)據(jù)標(biāo)識參數(shù)的建表語句,創(chuàng)建分析表,所述分析表中包含第一時間參數(shù)、第一存儲位置參數(shù)、第二時間參數(shù)和第二存儲位置參數(shù);
根據(jù)所述第一時間參數(shù)和所述第一存儲位置參數(shù),從所述數(shù)據(jù)庫之外的第一存儲系統(tǒng)中獲取所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù);
根據(jù)所述第二時間參數(shù)和所述第二存儲位置參數(shù),從所述數(shù)據(jù)庫之外的第二存儲系統(tǒng)中獲取所述第二時段內(nèi)的數(shù)據(jù)庫增量日志。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在從所述數(shù)據(jù)庫之外的第一存儲系統(tǒng)中獲取所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)之前,還包括:
在所述第一時間參數(shù)指示的第一時間點,將所述數(shù)據(jù)庫中的全量數(shù)據(jù),按照所述第一存儲系統(tǒng)支持的存儲格式備份至所述第一存儲系統(tǒng)中;
其中,所述第一時段是所述第一時間點之前的時段。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在從所述數(shù)據(jù)庫之外的第二存儲系統(tǒng)中獲取所述第二時段內(nèi)的數(shù)據(jù)庫增量日志之前,還包括:
在第三時間點,將所述數(shù)據(jù)庫在所述第二時間參數(shù)指示的第二時間點之后產(chǎn)生的增量日志拷貝到所述第二存儲系統(tǒng)中;所述第二時段是從所述第二時間點到所述第三時間點的時段。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第一時間點與所述第二時間點為同一時間點。
7.根據(jù)權(quán)利要求1-6任一項所述的方法,其特征在于,對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)和所述第二時段內(nèi)的數(shù)據(jù)庫增量日志進(jìn)行聯(lián)合分析,包括:
將所述第二時段內(nèi)的數(shù)據(jù)庫增量日志拆分為由插入操作形成的新增數(shù)據(jù)集和由刪除操作形成的刪除數(shù)據(jù)集;
將所述刪除數(shù)據(jù)集與所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行聯(lián)合分析,得到中間分析結(jié)果;
將所述新增數(shù)據(jù)集與所述中間分析結(jié)果進(jìn)行聯(lián)合分析,得到最終分析結(jié)果。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,將所述刪除數(shù)據(jù)集與所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行聯(lián)合分析,得到中間分析結(jié)果,包括:
利用所述刪除數(shù)據(jù)集和所述數(shù)據(jù)分析需求中的過濾操作,對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行過濾,得到中間分析結(jié)果。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,利用所述刪除數(shù)據(jù)集和所述數(shù)據(jù)分析需求中的過濾操作,對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行過濾,得到中間分析結(jié)果,包括:
利用所述刪除數(shù)據(jù)集對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行初始過濾,并利用所述過濾操作中的過濾條件對初始過濾后的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行二次過濾,得到中間分析結(jié)果;
或者
利用所述過濾操作中的過濾條件對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行初始過濾,并利用所述刪除數(shù)據(jù)集對初始過濾后的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行二次過濾,得到中間分析結(jié)果。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,將所述新增數(shù)據(jù)集與所述中間分析結(jié)果進(jìn)行聯(lián)合分析,得到最終分析結(jié)果,包括:
將所述新增數(shù)據(jù)集與所述中間分析結(jié)果進(jìn)行合并,得到合并后的數(shù)據(jù)庫數(shù)據(jù);
根據(jù)數(shù)據(jù)分析需求中的其它數(shù)據(jù)操作,繼續(xù)對所述合并后的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行分析處理,得到最終分析結(jié)果。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,利用所述刪除數(shù)據(jù)集和所述數(shù)據(jù)分析需求中的過濾操作,對所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行過濾,得到中間分析結(jié)果,包括:
將所述第一時段內(nèi)的數(shù)據(jù)庫數(shù)據(jù)進(jìn)行分片得到多個數(shù)據(jù)分片,并將所述多個數(shù)據(jù)分片分配到多個過濾節(jié)點;
將所述刪除數(shù)據(jù)集廣播給所述多個過濾節(jié)點,由所述多個過濾節(jié)點利用所述刪除數(shù)據(jù)集和數(shù)據(jù)分析需求中的過濾操作對各自負(fù)責(zé)的數(shù)據(jù)分片進(jìn)行過濾,并將過濾后的數(shù)據(jù)庫數(shù)據(jù)作為所述中間分析結(jié)果送入下游的合并節(jié)點。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,將所述新增數(shù)據(jù)集與所述中間分析結(jié)果進(jìn)行合并,得到合并后的數(shù)據(jù)庫數(shù)據(jù),包括:
由所述合并節(jié)點將所述新增數(shù)據(jù)集與所述中間分析結(jié)果進(jìn)行合并,并將合并后的數(shù)據(jù)庫數(shù)據(jù)送入后續(xù)其它節(jié)點;所述后續(xù)其它節(jié)點與數(shù)據(jù)分析需求中的其它數(shù)據(jù)操作對應(yīng)。
13.根據(jù)權(quán)利要求7所述的方法,其特征在于,在將所述第二時段內(nèi)的數(shù)據(jù)庫增量日志拆分為由插入操作形成的新增數(shù)據(jù)集和由刪除操作形成的刪除數(shù)據(jù)集之前,還包括:
根據(jù)所述數(shù)據(jù)分析需求中的數(shù)據(jù)操作,生成用于聯(lián)合分析的數(shù)據(jù)庫語句;
結(jié)合新增的負(fù)責(zé)處理數(shù)據(jù)庫增量日志的多個算子,對所述數(shù)據(jù)庫語句進(jìn)行優(yōu)化處理,以得到執(zhí)行計劃;
運(yùn)行所述執(zhí)行計劃,以實現(xiàn)將所述第二時段內(nèi)的數(shù)據(jù)庫增量日志拆分為由插入操作形成的新增數(shù)據(jù)集和由刪除操作形成的刪除數(shù)據(jù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:周祥,王燁,徐明明,趙永春,
申請(專利權(quán))人:阿里巴巴集團(tuán)控股有限公司,
類型:發(fā)明
國別省市:開曼群島;KY
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。