System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據治理與人工智能,具體的說是一種基于ai訓練模型與sql治理的時間標準化治理方法及系統。
技術介紹
1、在現代信息社會,時間數據是各類應用系統中不可或缺的一部分。然而,由于數據來源的多樣性以及采集過程中的不規范性,加上不同系統、不同來源的時間數據存在格式不統一、精度不一致等問題,采集方法也不盡相同,導致時間數據格式各異、難以統一處理。如在數據采集過程中,時間數據常常以不規則、不一致的格式出現,如“為期兩年”、“18個月”、“20個日歷日”等,而我們通常需要用這些數據與開始時間相加,得到最終結束時間。但這些數據給最終時間的數據治理和后續分析帶來了很大困難。因此,需要對這些數據進行標準化處理,以便進行統一的分析和應用。
2、傳統的數據治理方法往往依賴于人工進行修正和優化,效率低下且容易出錯。因此,本文設計提出了一種基于ai訓練模型與sql治理的時間標準化治理方法及系統,能夠高效準確地處理各種格式和來源的時間數據,具有重要的實際意義和應用價值。
技術實現思路
1、本專利技術針對目前技術發展的需求和不足之處,提供一種基于ai訓練模型與sql治理的時間標準化治理方法及系統。
2、第一方面,本專利技術提供一種基于ai訓練模型與sql治理的時間標準化治理方法,解決上述技術問題采用的技術方案如下:
3、一種基于ai訓練模型與sql治理的時間標準化治理方法,其包括如下步驟:
4、s1、預訓練一個ai大模型,來識別并解析不規則的時間數據,
5、s2、將ai大模型解析后的時間數據與原始時間數據關聯,并存儲在sql數據庫中;
6、s3、根據解析后的時間數據格式構建sql語句,通過構建的sql語句對數據庫中的時間數據進行操作,以計算得到標準化的結束時間。
7、可選的,所涉及ai大模型的預訓練過程如下:
8、采集包含不規則時間數據的文本信息,進行人工標注,將時間數據轉換為統一的格式,作為ai大模型的訓練數據;
9、利用訓練數據進行ai大模型的訓練,訓練后的ai大模型能夠識別并解析不規則的時間數據,輸出標準化的時間格式;
10、將訓練好的ai大模型應用于實際的時間數據解析任務中,ai大模型基于輸入的不規則時間數據輸出解析后的標準化時間格式。
11、優選的,通過python腳本從網站采集包含不規則時間數據的文本信息。
12、優選的,預訓練一個適用于自然語言處理的ai大模型。
13、可選的,執行步驟s3,根據解析后的時間數據格式構建sql語句,將構建好的sql語句在數據庫中執行,對ai大模型解析出的時間與原始時間進行相加或相減操作,得到標準化的結束時間。
14、第二方面,本專利技術提供一種基于ai訓練模型與sql治理的時間標準化治理系統,解決上述技術問題采用的技術方案如下:
15、一種基于ai訓練模型與sql治理的時間標準化治理系統,其包括:
16、預訓練模塊,用于預訓練一個ai大模型,來識別并解析不規則的時間數據,輸出標準化的時間格式;
17、關聯存儲模塊,用于將ai大模型解析后的時間數據與原始時間數據關聯,并存儲在sql數據庫中;
18、構建執行模塊,用于根據ai大模型解析后的時間數據格式構建sql語句,通過構建的sql語句對數據庫中的時間數據進行操作,以計算得到標準化的結束時間。
19、可選的,所涉及預訓練模塊又包括:
20、信息采集子模塊,用于采集包含不規則時間數據的文本信息;
21、數據標注子模塊,用于輔助人工進行時間數據的標注;
22、格式轉換子模塊,用于將人工標注的時間數據轉換為統一的格式,作為ai大模型的訓練數據;
23、模型訓練子模塊,用于利用訓練數據進行ai大模型的訓練,訓練后的ai大模型能夠識別并解析不規則的時間數據,輸出標準化的時間格式。
24、優選的,所涉及信息采集子模塊通過python腳本從網站采集包含不規則時間數據的文本信息。
25、優選的,所涉及預訓練模塊預訓練一個適用于自然語言處理的ai大模型。
26、可選的,所涉及構建執行模塊首先根據解析后的時間數據格式構建sql語句,隨后將構建好的sql語句在數據庫中執行,對ai大模型解析出的時間與原始時間進行相加或相減操作,得到標準化的結束時間。
27、本專利技術的一種基于ai訓練模型與sql治理的時間標準化治理方法及系統,與現有技術相比具有的有益效果是:
28、1、本專利技術能夠自動、準確地將各種不規則時間數據轉換為統一格式的方法,并通過sql語句對時間進行篩選和批量計算,實現時間數據的標準化處理,從而提高數據治理的效率和準確;
29、2、本專利技術通過結合ai大模型解析和sql治理的方法,可以實現對各種不規則時間數據的自動、準確解析和標準化處理,通過開始時間及項目周期或工期,實現對結束時間數據的標準化治理及獲取,這不僅可以提高數據治理的效率和準確率,還為后續的數據分析和應用提供了可靠的基礎,具有較高的靈活性和可擴展性,能夠適應不同應用場景的需求。
本文檔來自技高網...【技術保護點】
1.一種基于AI訓練模型與SQL治理的時間標準化治理方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于AI訓練模型與SQL治理的時間標準化治理方法,其特征在于,所述AI大模型的預訓練過程如下:
3.根據權利要求2所述的基于AI訓練模型與SQL治理的時間標準化治理方法,其特征在于,通過python腳本從網站采集包含不規則時間數據的文本信息。
4.根據權利要求2所述的基于AI訓練模型與SQL治理的時間標準化治理方法,其特征在于,預訓練一個適用于自然語言處理的AI大模型。
5.根據權利要求1所述的基于AI訓練模型與SQL治理的時間標準化治理方法,其特征在于,執行步驟S3,根據解析后的時間數據格式構建SQL語句,將構建好的SQL語句在數據庫中執行,對AI大模型解析出的時間與原始時間進行相加或相減操作,得到標準化的結束時間。
6.一種基于AI訓練模型與SQL治理的時間標準化治理系統,其特征在于,其包括:
7.根據權利要求6所述的基于AI訓練模型與SQL治理的時間標準化治理系統,其特征在于,所述預訓練模塊又包
8.根據權利要求7所述的基于AI訓練模型與SQL治理的時間標準化治理系統,其特征在于,所述信息采集子模塊通過python腳本從網站采集包含不規則時間數據的文本信息。
9.根據權利要求7所述的基于AI訓練模型與SQL治理的時間標準化治理系統,其特征在于,所述預訓練模塊預訓練一個適用于自然語言處理的AI大模型。
10.根據權利要求6所述的基于AI訓練模型與SQL治理的時間標準化治理系統,其特征在于,所述構建執行模塊首先根據解析后的時間數據格式構建SQL語句,隨后將構建好的SQL語句在數據庫中執行,對AI大模型解析出的時間與原始時間進行相加或相減操作,得到標準化的結束時間。
...【技術特征摘要】
1.一種基于ai訓練模型與sql治理的時間標準化治理方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于ai訓練模型與sql治理的時間標準化治理方法,其特征在于,所述ai大模型的預訓練過程如下:
3.根據權利要求2所述的基于ai訓練模型與sql治理的時間標準化治理方法,其特征在于,通過python腳本從網站采集包含不規則時間數據的文本信息。
4.根據權利要求2所述的基于ai訓練模型與sql治理的時間標準化治理方法,其特征在于,預訓練一個適用于自然語言處理的ai大模型。
5.根據權利要求1所述的基于ai訓練模型與sql治理的時間標準化治理方法,其特征在于,執行步驟s3,根據解析后的時間數據格式構建sql語句,將構建好的sql語句在數據庫中執行,對ai大模型解析出的時間與原始時間進行相加或相減操作,得到標準化的結束時間。
6.一種...
【專利技術屬性】
技術研發人員:楊璞,趙子墨,申傳旺,
申請(專利權)人:浪潮卓數大數據產業發展有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。