System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理,具體地說是基層報表融合系統及方法。
技術介紹
1、隨著信息化時代的深入發展,在信息化時代不斷深化的背景下,基層工作人員正面臨前所未有的挑戰。他們需要應對來自眾多上級部門的大量表單填報任務,這不僅工作量巨大,而且嚴重占用了本應用于實地調研的時間,從而影響了基層工作的效率提升。目前,基層工作人員主要面臨以下幾方面的問題:
2、(1)表單填報任務繁重,涉及的業務條線廣泛:基層工作人員需同時滿足數十家上級部門和單位的數據需求,這些部門頻繁且大量地要求數據,使得基層人員不得不投入大量精力完成繁瑣的報表填寫工作;
3、(2)多頭錄入與重復填報:由于報表系統分散于各個業務條線,且不同上級部門和單位之間缺乏有效的協調,導致下發的報表內容和格式不統一,進而造成基層人員不得不進行重復填報;
4、(3)數據共享不暢,影響工作效率:部門間的數據壁壘和信息孤島問題嚴重,基層工作人員在上報數據時需要手動整合各部門的信息,這不僅增加了工作量,還容易導致信息的遺漏和偏差。
5、對于表單填報任務,如何優化數據采集及融合流程、高效準確的提供數據報表,是需要解決的技術問題。
技術實現思路
1、本專利技術的技術任務是針對以上不足,提供基層報表融合系統及方法,來解決如何優化數據采集及融合流程、高效準確的提供數據報表的技術問題。
2、第一方面,本專利技術一種基層報表融合系統,包括報表下發模塊、大數據主管模塊以及報表上報模塊;
3、
4、所述大數據主管模塊通過大數據主管界面面向作為用戶的大數據主管部門,
5、用于匯總各個報表下發部門上傳的報表,通過對報表進行信息提取、數據分析和標準化處理得到臺賬,并將臺賬上傳報表上報模塊,其中,臺賬包括共性臺賬和各部門個性化特征,共性臺賬為基于各報表的共性信息生成的臺賬,個性化臺賬為將各報表中不屬于共性臺賬的信息進行融合生成的臺賬;
6、所述報表上報模塊通過報表上報界面面向作為用戶的報表上報部門,用于支持各報表上報部門對下發的臺賬進行審核確認,對于通過確認的臺賬,用于支持報表上報部門進行臺賬填報,對于未通過確認的臺賬,用于將報表上報部門反饋的修改意見返回大數據主管模塊;對應的,所述大數據主管模塊用于支持大數據主管部門基于修改意見對臺賬進行修改。
7、作為優選,共性臺賬覆蓋人、地、事、物、情和組織六個分類,用于全面記錄和追蹤政務工作相關各類信息,共性臺賬由各個報表上報部門共同維護;
8、個性化臺賬側重于特定政務工作,包括如下類型:
9、部門專用臺賬:針對特定政務定制的臺賬,包括稅務登記和稅收統計臺賬、環境監測和污染處理記錄臺賬;
10、項目跟蹤臺賬:用于記錄項目的進展、資金使用情況以及效果評估;
11、應急管理臺賬:針對突發事件或緊急情況設定的臺賬,用于記錄應急響應的各個環節、資源調配和救援行動;
12、民生服務臺賬:針對社會保障、醫療衛生和教育,用于記錄服務提供情況、民眾反饋情況;
13、特定群體管理臺賬:針對低收入家庭、殘疾人以及老年人的管理和服務臺賬。
14、作為優選,通過對報表進行信息提取、數據分析和標準化處理得到臺賬,包括如下步驟:
15、對報表進行格式轉換,得到可處理的結構化數據格式,其中,對于表格類的報表,提取表格中的數據,對于固定模板樣式的非結構化表格文本,基于計算機視覺技術和光學字符識別技術、將表格文本格式轉換為結構化數據格式;
16、對于結構化數據格式的報表,對從報表中提取的信息進行融合去重,通過融合去重操作實現同一個信息在不同報表的統一描述,并去重冗余信息,實現信息的一致性和唯一性;
17、對于融合去重后的信息,根據信息的相關性以及信息所屬報表的類別,對信息進行分類;
18、根據分類后的信息構建臺賬,臺賬中包括關鍵數據點,關鍵數據點包括時間、地點、組織機構、政策名稱、機構名稱以及人員姓名。
19、作為優選,對于固定模板樣式的非結構化表格文本,通過如下步驟將表格文本格式轉換為結構化數據格式:
20、預處理:獲取歷史報表作為樣本報表,對于固定模板樣式的pdf文檔或word文檔,將文檔轉換為圖像,并對文檔進行頁面分割、去噪和圖像增強操作;
21、構建模型:基于計算機視覺技術構建布局分析模型,基于canny邊緣檢測算法構建表格識別定位模型,基于光學字符識別技術構建文字提取模型,布局分析模型用于對輸入的圖像進行布局分析,表格識別定位模型用于對表格中元素進行識別定位,元素包括行、列以及單元格邊界,文字提取模型用于識別并提取表格中的文字信息,將圖像中的文字轉換為可編輯的文本格式;
22、模型訓練:基于布局分析模型、表格識別定位模型和文字提取模型對預處理后的樣本報表數據結構化會處理,將從報表提取的信息轉換成結構化數據,并基于得到結構化數據對布局分析模型、表格識別定位模型和文字提取模型進行模型訓練,得到訓練后的布局分析模型、表格識別定位模型和文字提取模型;
23、生成結構化數據:對于待處理的報表,對報表進行預處理,并基于訓練后的布局分析模型、表格識別定位模型和文字提取模型對預處理后的報表執行數據結構后處理,將從待處理報表提取的信息轉換成結構化數據;
24、數據驗證與校正:對生成的結構化數據進行驗證和校正,并基于反饋對訓練后的布局分析模型、表格識別定位模型和文字提取模型進行訓練優化。
25、作為優選,對從報表中提取的信息進行融合去重時,將信息作為實體,利用關系抽取算法、捕捉實體之間的關聯,并構建信息之間的邏輯鏈路,基于實體之間關聯、信息之間邏輯鏈路以及預先配置的政務領域知識庫,實現同一個信息在不同報表的統一描述,并去重冗余信息。
26、第二方面,本專利技術一種基層報表融合方法,通過如第一方面任一項所述的一種基層報表融合系統實現基層報表融合,所述方法包括如下步驟:
27、報表下發:各報表下發部門通過報表下發模塊上傳日常收集的數據、并將數據以報表的形式上傳至大數據主管模塊;
28、臺賬生成:大數據主管部門通過大數據主管模塊匯總各個報表下發部門上傳的報表,通過對報表進行信息提取、數據分析和標準化處理得到臺賬,并將臺賬上傳報表上報模塊,其中,臺賬包括共性臺賬和各部門個性化特征,共性臺賬為基于各報表的共性信息生成的臺賬,個性化臺賬為將各報表中不屬于共性臺賬的信息進行融合生成的臺賬;
29、報表上報:各報表上報部門通過報表上報模塊對下發的臺賬進行審核確認,對于通過確認的臺賬,報表上報部門進行臺賬填報,對于未通過確認的臺賬,將報表上報部門反饋的修改意見返回大數據主管模塊;對應的,大數據主管部門基于修改意見、本文檔來自技高網...
【技術保護點】
1.一種基層報表融合系統,其特征在于,包括報表下發模塊、大數據主管模塊以及報表上報模塊;
2.根據權利要求1所述的基層報表融合系統,其特征在于,共性臺賬覆蓋人、地、事、物、情和組織六個分類,用于全面記錄和追蹤政務工作相關各類信息,共性臺賬由各個報表上報部門共同維護;
3.根據權利要求1或2所述的基層報表融合系統,其特征在于,通過對報表進行信息提取、數據分析和標準化處理得到臺賬,包括如下步驟:
4.根據權利要求3所述的基層報表融合系統,其特征在于,對于固定模板樣式的非結構化表格文本,通過如下步驟將表格文本格式轉換為結構化數據格式:
5.根據權利要求3所述的基層報表融合系統,其特征在于,對從報表中提取的信息進行融合去重時,將信息作為實體,利用關系抽取算法、捕捉實體之間的關聯,并構建信息之間的邏輯鏈路,基于實體之間關聯、信息之間邏輯鏈路以及預先配置的政務領域知識庫,實現同一個信息在不同報表的統一描述,并去重冗余信息。
6.一種基層報表融合方法,其特征在于,通過如權利要求1-5任一項所述的一種基層報表融合系統實現基層報表融合,所
7.根據權利要求6所述的基層報表融合方法,其特征在于,共性臺賬覆蓋人、地、事、物、情和組織六個分類,用于全面記錄和追蹤政務工作相關各類信息,共性臺賬由各個報表上報部門共同維護;
8.根據權利要求6或7所述的基層報表融合方法,其特征在于,通過對報表進行信息提取、數據分析和標準化處理得到臺賬,包括如下步驟:
9.根據權利要求8所述的基層報表融合方法,其特征在于,對于固定模板樣式的非結構化表格文本,通過如下步驟將表格文本格式轉換為結構化數據格式:
10.根據權利要求8所述的基層報表融合方法,其特征在于,對從報表中提取的信息進行融合去重時,將信息作為實體,利用關系抽取算法、捕捉實體之間的關聯,并構建信息之間的邏輯鏈路,基于實體之間關聯、信息之間邏輯鏈路以及預先配置的政務領域知識庫,實現同一個信息在不同報表的統一描述,并去重冗余信息。
...【技術特征摘要】
1.一種基層報表融合系統,其特征在于,包括報表下發模塊、大數據主管模塊以及報表上報模塊;
2.根據權利要求1所述的基層報表融合系統,其特征在于,共性臺賬覆蓋人、地、事、物、情和組織六個分類,用于全面記錄和追蹤政務工作相關各類信息,共性臺賬由各個報表上報部門共同維護;
3.根據權利要求1或2所述的基層報表融合系統,其特征在于,通過對報表進行信息提取、數據分析和標準化處理得到臺賬,包括如下步驟:
4.根據權利要求3所述的基層報表融合系統,其特征在于,對于固定模板樣式的非結構化表格文本,通過如下步驟將表格文本格式轉換為結構化數據格式:
5.根據權利要求3所述的基層報表融合系統,其特征在于,對從報表中提取的信息進行融合去重時,將信息作為實體,利用關系抽取算法、捕捉實體之間的關聯,并構建信息之間的邏輯鏈路,基于實體之間關聯、信息之間邏輯鏈路以及預先配置的政務領域知識庫,實現同一個信息在不同報表的統一描述,并去重冗余信息。
6.一種基層報表...
【專利技術屬性】
技術研發人員:張棟,張旭,李連偉,周慶勇,
申請(專利權)人:浪潮云信息技術股份公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。