System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及電力工程檔案管理,特別指一種基于ai的電力工程檔案知識服務方法與系統。
技術介紹
1、電力工程項目往往涉及大量的電力工程檔案(檔案文件),如設計圖紙、施工記錄文件、審批文件、設備信息、維護日志等,這些電力工程檔案的數據量龐大且種類繁多,在電力工程項目施工的過程中就要同步對這些電力工程檔案進行管理,以保障電力工程項目的施工質量并便于后期溯源。
2、針對電力工程檔案的管理,傳統上依賴人工對紙質的電力工程檔案進行收集、分類、編目、存儲、借閱、錄入檔案管理系統,電子化程度不高,存在如下缺點:
3、1、人工操作導致電力工程檔案的管理效率低下,且容易出現管理疏漏;2、電力工程檔案的查詢依賴于手工翻閱或簡單的電子搜索,難以滿足用檔人快速、準確的查詢需求及關聯檔案參考佐證需求;3、較難確定各部門的歸檔時間、責任人和保管方式,電力工程檔案的時效性和完整性易受到影響;4、缺乏統一的歸檔標準,易導致歸檔文件不齊全、歸檔內容不規范、分類不明確、編號混亂、檔案錯漏等問題;5、檔案管理系統往往只具備基本的存儲和查詢功能,缺乏知識挖掘和智能分析的能力,無法從海量的電子工程檔案中提取有價值的信息和知識。
4、因此,如何提供一種基于ai的電力工程檔案知識服務方法與系統,實現提升電力工程檔案管理的質量以及效率,成為一個亟待解決的技術問題。
技術實現思路
1、本專利技術要解決的技術問題,在于提供一種基于ai的電力工程檔案知識服務方法與系統,實現提升電力工程檔案管理的質量
2、第一方面,本專利技術提供了一種基于ai的電力工程檔案知識服務方法,包括如下步驟:
3、步驟s1、獲取大量的電力工程的歷史檔案文本,對各所述歷史檔案文本進行預處理和標注后構建數據集;
4、步驟s2、基于神經網絡創建一用于識別實體、屬性以及關系的檔案知識提取模型,基于所述數據集對檔案知識提取模型進行訓練;從所述數據集中收集歷史歸檔信息,通過大數據技術從各所述歷史歸檔信息中挖掘歸檔規律,基于所述歸檔規律設定對應的歸檔模板;
5、步驟s3、通過etl工具獲取待管理的電力工程檔案文件,通過yolo模型對所述電力工程檔案文件進行復印件鑒別;
6、步驟s4、通過ocr技術從所述電力工程檔案文件中識別電力工程檔案文本,對所述電力工程檔案文本進行預處理;
7、步驟s5、將預處理后的所述電力工程檔案文本輸入檔案知識提取模型,得到包括實體、屬性以及關系的檔案知識,基于各所述檔案知識構建檔案知識圖譜;
8、步驟s6、從所述電力工程檔案文件中提取歸檔信息,基于所述歸檔信息以及歸檔規律生成攜帶推薦的歸檔模板的歸檔提醒通知,以執行歸檔操作;
9、步驟s7、歸檔過程中記錄歸檔特征,基于所述歸檔特征進行歸檔合規性檢查;
10、步驟s8、通過生成式ai技術對基于自然語言技術輸入的檢索語句進行轉換,生成檢索指令,基于所述檢索指令以及檔案知識圖譜對電力工程檔案文件進行檢索和溯源。
11、進一步的,所述步驟s1具體為:
12、獲取大量的電力工程的歷史檔案文本,對各所述歷史檔案文本進行至少包括數據清洗、格式轉換以及數據整合的預處理,基于模式層對預處理后的各所述歷史檔案文本進行實體、屬性以及關系的標注,基于標注后的各所述歷史檔案文本構建數據集;
13、所述步驟s2具體為:
14、基于神經網絡創建一用于識別實體、屬性以及關系的檔案知識提取模型,基于預設比例將所述數據集劃分為訓練集和驗證集,基于所述訓練集對檔案知識提取模型進行訓練,直至滿足預設的收斂條件,再基于所述驗證集對訓練后的檔案知識提取模型進行驗證,判斷提取準確率是否大于預設的準確率閾值,若是,則結束訓練;若否,則擴充所述訓練集繼續訓練;
15、從所述數據集中收集至少包括歸檔時間、內容類型、項目類型以及項目階段的歷史歸檔信息,通過大數據技術從各所述歷史歸檔信息中挖掘歸檔規律,基于所述歸檔規律設定對應的歸檔模板。
16、進一步的,所述步驟s3具體為:
17、通過etl工具獲取待管理的電力工程檔案文件,通過yolo模型識別所述電力工程檔案文件中至少包括清晰度、色彩還原度、對比度、印章大小以及印章顏色的圖像特征,基于各所述圖像特征對電力工程檔案文件進行復印件鑒別;
18、所述步驟s4具體為:
19、通過ocr技術從所述電力工程檔案文件中識別電力工程檔案文本,對所述電力工程檔案文本進行至少包括數據清洗、格式轉換以及數據整合的預處理。
20、進一步的,所述步驟s6具體為:
21、從所述電力工程檔案文件中提取至少包括歸檔時間、內容類型、項目類型以及項目階段的歸檔信息,基于所述歸檔信息以及歸檔規律生成歸檔提醒通知,通過顯示屏顯示所述歸檔提醒通知,或者將所述歸檔提醒通知自動推送給預先關聯的管理終端,以執行歸檔操作。
22、進一步的,所述步驟s7具體為:
23、歸檔過程中,記錄至少包括檔號樣式、標題規范以及檔案模板的歸檔特征,通過預訓練的大模型,基于各所述歸檔特征、歸檔規律、預設的歸檔規則進行歸檔合規性檢查;
24、所述歸檔規則至少包括歸檔條目、歸檔目錄、檔號樣式、標題規范以及檔案模板;所述歸檔條目至少包括案卷號、文件號、文件名稱、案卷名稱、文件類型以及文件描述;所述歸檔目錄即電力工程檔案文件的存儲目錄。
25、第二方面,本專利技術提供了一種基于ai的電力工程檔案知識服務系統,包括如下模塊:
26、數據集構建模塊,用于獲取大量的電力工程的歷史檔案文本,對各所述歷史檔案文本進行預處理和標注后構建數據集;
27、模型訓練模塊,用于基于神經網絡創建一用于識別實體、屬性以及關系的檔案知識提取模型,基于所述數據集對檔案知識提取模型進行訓練;從所述數據集中收集歷史歸檔信息,通過大數據技術從各所述歷史歸檔信息中挖掘歸檔規律,基于所述歸檔規律設定對應的歸檔模板;
28、復印件鑒別模塊,用于通過etl工具獲取待管理的電力工程檔案文件,通過yolo模型對所述電力工程檔案文件進行復印件鑒別;
29、檔案文本識別模塊,用于通過ocr技術從所述電力工程檔案文件中識別電力工程檔案文本,對所述電力工程檔案文本進行預處理;
30、知識圖譜構建模塊,用于將預處理后的所述電力工程檔案文本輸入檔案知識提取模型,得到包括實體、屬性以及關系的檔案知識,基于各所述檔案知識構建檔案知識圖譜;
31、歸檔提醒模塊,用于從所述電力工程檔案文件中提取歸檔信息,基于所述歸檔信息以及歸檔規律生成攜帶推薦的歸檔模板的歸檔提醒通知,以執行歸檔操作;
32、合規檢查模塊,用于歸檔過程中記錄歸檔特征,基于所述歸檔特征進行歸檔合規性檢查;
33、知識問答模塊,用于通過生成式ai技術對基于自然語言技術輸入的檢索語句進行轉換,生成檢索本文檔來自技高網...
【技術保護點】
1.一種基于AI的電力工程檔案知識服務方法,其特征在于:包括如下步驟:
2.如權利要求1所述的一種基于AI的電力工程檔案知識服務方法,其特征在于:所述步驟S1具體為:
3.如權利要求1所述的一種基于AI的電力工程檔案知識服務方法,其特征在于:所述步驟S3具體為:
4.如權利要求1所述的一種基于AI的電力工程檔案知識服務方法,其特征在于:所述步驟S6具體為:
5.如權利要求1所述的一種基于AI的電力工程檔案知識服務方法,其特征在于:所述步驟S7具體為:
6.一種基于AI的電力工程檔案知識服務系統,其特征在于:包括如下模塊:
7.如權利要求6所述的一種基于AI的電力工程檔案知識服務系統,其特征在于:所述數據集構建模塊具體用于:
8.如權利要求6所述的一種基于AI的電力工程檔案知識服務系統,其特征在于:所述復印件鑒別模塊具體用于:
9.如權利要求6所述的一種基于AI的電力工程檔案知識服務系統,其特征在于:所述歸檔提醒模塊具體用于:
10.如權利要求6所述的一種基于AI的電力工程檔
...【技術特征摘要】
1.一種基于ai的電力工程檔案知識服務方法,其特征在于:包括如下步驟:
2.如權利要求1所述的一種基于ai的電力工程檔案知識服務方法,其特征在于:所述步驟s1具體為:
3.如權利要求1所述的一種基于ai的電力工程檔案知識服務方法,其特征在于:所述步驟s3具體為:
4.如權利要求1所述的一種基于ai的電力工程檔案知識服務方法,其特征在于:所述步驟s6具體為:
5.如權利要求1所述的一種基于ai的電力工程檔案知識服務方法,其特征在于:所述步驟s7具體為:
6.一種...
【專利技術屬性】
技術研發人員:鄭敏,
申請(專利權)人:內蒙古電力集團有限責任公司包頭供電分公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。