System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據識別,尤其涉及一種基于知識管理識別主數據的數據治理系統。
技術介紹
1、主數據是用來描述核心業務實體的數據,是交易業務的執行主體,是在整個價值鏈上被重復或共享應用于多個業務流程、跨越多個業務部門和系統、高價值的基礎數據。
2、主數據管理是數據治理的重要組成部分,主數據管理的第一步是要識別主數據。符合主數據特征的數據我們可以識別為主數據,即核心業務數據、變化緩慢或變化周期長、有共享需求、有被重復利用的價值的數據。?在數據治理項目中識別主數據的方法是先對現有的業務數據進行調研和分析,再進行用戶訪談,最后確定主數據。組織單位信息系統多、數據庫中的數據表多、缺少數據庫說明書等因素導致在實施數據治理項目中識別主數據效率低下。
3、主數據的重要性在于它可以作為業務實體的核心數據,為企業的各個部門和系統提供統一、可靠的數據來源,從而提高數據的準確性和一致性,為企業的決策和運營提供有力支持。因此,主數據管理不僅僅是識別主數據,更是需要建立完善的數據管理流程和規范,確保主數據的質量和可靠性,實現數據的價值最大化。
4、因此,需要提供一種新的以主數據為核心的數據治理系統,來提高數據的利用價值。
技術實現思路
1、有鑒于此,本專利技術提供一種基于知識管理識別主數據的數據治理系統,通過增加知識庫和實施工作臺,實現各項目實施工作的知識共享,自動生成數據源報告,提高數據調研的效率,并將識別主數據的結果快速應用到數據治理中。
2、本專利技術的技術
3、本專利技術提供一種基于知識管理識別主數據的數據治理系統,包括:
4、數據治理子系統,其配置為對數據的獲取、處理和使用進行監管,并在各項目中獨立部署;數據治理子系統包括元數據管理模塊、數據標準管理模塊、主數據管理模塊、數據調度模塊、數據質量管理模塊和數據安全管理模塊;
5、知識庫,其配置為預存儲供應商系統表、數據字典表和主數據表;
6、實施工作臺,其配置為與數據治理子系統和知識庫進行數據和知識交互,在實施項目時生成數據源報告,并對主數據進行識別;
7、生成數據源報告的過程為:
8、步驟一、數據治理子系統連接當前項目的數據源,利用元數據管理模塊采集數據源的元數據;
9、步驟二、從知識庫按照第一推薦方法獲取數據字典推薦結果,包括模式名、表英文名、表中文名、字段英文名和字段中文名;
10、步驟三、將元數據與數據字典推薦結果進行表英文名和字段英文名的匹配,將匹配成功的數據字典推薦結果的表英文名和字段英文名對應的表中文名和字段中文名補充進相應元數據中,得到補充后的元數據,以及匹配過程中得到的元數據對應的數據字典;
11、步驟四、將數據字典保存至知識庫中;
12、步驟五、根據補充后的元數據生成數據源報告,數據源報告包括數據源信息、數據表信息和表字段信息,數據源信息包括:數據源類型、數據源名稱、系統、模式名、表英文名、表中文名、字段數、數據量和占用空間,數據表信息包括:模式名、表英文名、表中文名、字段數、數據量和注釋,表字段信息包括:字段英文名、字段中文名、數據類型、長度、是否必填、是否主鍵和注釋;
13、步驟六、實施工作臺將補充后的元數據和數據字典同步到數據治理子系統。
14、在上述技術方案的基礎上,優選的,步驟二中,第一推薦方法包括:
15、當前項目的數據源的元素包括供應商、系統、版本、數據源類型、ip、端口、用戶和密碼;供應商系統表的元素包括系統編號、供應商、系統、版本、數據字典編碼和主數據編碼;數據字典表的元素包括數據字典編碼、數據庫的模式、表英文名、表中文名、字段英文名和字段中文名;
16、根據當前項目的數據源的供應商、系統和版本在供應商系統表中查詢匹配,得到數據源對應的目標數據字典編碼;
17、在數據字典表中根據目標數據字典編碼查詢得到與該數據源相關的數據字典信息,形成數據字典推薦結果。
18、在上述技術方案的基礎上,優選的,步驟三包括:
19、遍歷元數據,查找表中文名的內容缺失的元數據,作為第一待補元數據,查找字段中文名的內容缺失的元數據,作為第二待補元數據;
20、遍歷第一待補元數據,實施工作臺根據數據字典推薦結果中的表英文名在第一待補元數據中匹配相同的表英文名,將匹配成功的數據字典推薦結果中的表英文名作為第一目標表英文名,獲取第一目標表英文名相應的表中文名作為第一目標表中文名,將第一目標表中文名補充至第一待補元數據中,得到第一補充元數據;
21、遍歷第二待補元數據,實施工作臺根據數據字典推薦結果中的表英文名和字段英文名在第二待補元數據中匹配相同的表英文名和字段英文名,將匹配成功的數據字典推薦結果中的表英文名和字段英文名作為第二目標表英文名和第二目標字段英文名,獲取第二目標表英文名相應的表中文名作為第二目標表中文名,獲取第二目標字段英文名相應的字段中文名作為第二目標字段中文名,將第二目標表中文名和第二目標字段中文名補充至第二待補元數據中,得到第二補充元數據;
22、判斷第一待補元數據和第二待補元數據是否均補充完畢,若是,則結束匹配過程,將第一補充元數據和第二補充元數據進行合并去重后更新至元數據中,得到補充后的元數據,并根據匹配過程中匹配到的數據字典推薦結果中的信息形成元數據對應的數據字典;若否,則采用人工補充方式對第一待補元數據和第二待補元數據進行二次補充,根據二次補充的結果得到補充后的元數據,以及元數據對應的數據字典。
23、在上述技術方案的基礎上,優選的,人工補充方式包括:
24、收集數據源相關的文檔資料,在文檔資料中篩選與元數據相關的信息,根據信息得到缺失的表中文名和缺失的字段中文名,將其補充至第一待補元數據或第二待補元數據中,得到二次補充的結果。
25、在上述技術方案的基礎上,優選的,對主數據進行識別的過程為:
26、第一步、獲取生成的數據源報告;
27、第二步、從知識庫按照第二推薦方法獲取主數據推薦結果,主數據推薦結果包括模式名、表英文名和表中文名;
28、第三步、根據數據源報告和主數據推薦結果,按照篩選方法得到該數據源的主數據識別結果,主數據識別結果包括項目名稱、供應商、系統、版本、模式名、表英文名和表中文名;
29、第四步、將該數據源的主數據識別結果保存至知識庫中;
30、第五步、將該數據源的主數據識別結果同步到數據治理子系統;
31、第六步、數據治理子系統建立從數據源到數據倉庫ods層的數據采集關系,并在數據調度模塊設置該數據采集關系的定時任務。
32、在上述技術方案的基礎上,優選的,第二步中,第二推薦方法包括:
33、主數據表包括主數據編碼、數據庫的模式、表英文名和表中文名;
34、根據當前項目的數據源的供應商、系統和版本在供應商本文檔來自技高網...
【技術保護點】
1.一種基于知識管理識別主數據的數據治理系統,其特征在于,包括:
2.如權利要求1所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,步驟二中,第一推薦方法包括:
3.如權利要求2所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,步驟三包括:
4.如權利要求3所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,人工補充方式包括:
5.如權利要求2所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,對主數據進行識別的過程為:
6.如權利要求5所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,第二步中,第二推薦方法包括:
7.如權利要求5所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,第三步包括:
8.如權利要求5所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,第六步包括:
【技術特征摘要】
1.一種基于知識管理識別主數據的數據治理系統,其特征在于,包括:
2.如權利要求1所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,步驟二中,第一推薦方法包括:
3.如權利要求2所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,步驟三包括:
4.如權利要求3所述的一種基于知識管理識別主數據的數據治理系統,其特征在于,人工補充方式包括:
5.如權利...
【專利技術屬性】
技術研發人員:胡琦,嚴鶴,閆喜軍,王俊,
申請(專利權)人:云啟智慧科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。