System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及報告編制領域,特別地涉及一種報告編制防差錯處理方法、裝置、電子設備及存儲介質。
技術介紹
1、目前,針對各類復雜報告的報告編制,如企業工作報告、esg報告、年報、審計報告、招標文件、投標文件、項目建議書、可行性研究報告等,一般是由人工參考類似專業技術報告、論文文獻、歷史報告,結合基礎資料等直接編制。隨著報告編制的文本內容越來越復雜,對報告編制的質量和效率要求也越來越高。
2、上述報告編制方法的人為因素影響較大,不同編制人員的水平、經驗和報告編寫習慣不同,往往導致報告編寫質量不一,無法形成標準統一、高質量的報告成果。隨著信息技術的快速發展,基于卷積神經網絡的文本分類模型(text?cnn)日漸成熟,在新聞領域、文學創作領域的文字創作,已經有較多應用,但利用文本分類模型輔助提高專業技術報告的編制質量,預防報告編寫差錯處理方面還鮮有應用。因此,亟需建立一種基于text?cnn技術的報告編制防差錯處理方法來提高報告編制的質量和效率。
技術實現思路
1、本專利技術的目的在于提供一種報告編制防差錯處理方法、裝置、電子設備及存儲介質,能夠幫助編制人員快速熟悉和編制報告,幫助編制人員、審核人員快速發現存在問題,及減少報告常規性、常識性、規范性的錯誤重復發生。
2、第一方面,本申請提供了一種報告編制防差錯處理方法,包括:
3、獲取待審核的報告章節文本;
4、將所述報告章節文本輸入至預訓練的防差錯分類模型中,輸出得到所述報告章節文本所屬的目
5、根據所述報告章節文本所屬的目標編制差錯類型,生成并輸出防差錯提醒信息。
6、可選地,訓練所述防差錯分類模型的過程,包括:獲取已標注編制差錯類型的報告章節文本樣本,其中同一報告章節文本樣本允許被同時標注如下至少一種編制差錯類型:審核問題差錯、編制關注點差錯、編制指南差錯和編制規范差錯;構建待訓練的防差錯分類模型,所述防差錯分類模型包括詞嵌入層、特征提取層和全連接層;將所述報告章節文本樣本輸入至所述詞嵌入層得到文本向量,將所述文本向量輸入至所述特征提取層進行特征提取得到文本特征,將文本特征輸入至所述全連接層,以得到所述報告章節文本樣本所屬的編制差錯類型;基于預測的所述報告章節文本樣本所屬的編制差錯類型以及所述報告章節文本樣本的標注編制差錯類型,構建損失函數,并基于所述損失函數對所述待訓練的防差錯分類模型進行訓練,得到預訓好的所述防差錯分類模型。
7、可選地,所述特征提取層包括審核問題分支網絡、編制關注點分支網絡、編制指南分支網絡和編制規范分支網絡;所述全連接層包括四個獨立的全連接網絡;
8、將所述文本向量輸入至所述特征提取層進行特征提取得到文本特征,包括:
9、將所述文本向量分別輸入至所述審核問題分支網絡和所述編制關注點分支網絡,以分別得到審核問題差錯特征和編制關注點差錯特征;
10、將所述審核問題差錯特征和所述編制關注點差錯特征融合后分別輸入至所述編制指南分支網絡和所述編制規范分支網絡,以分別得到編制指南差錯特征和編制規范差錯特征;
11、將文本特征輸入至所述全連接層,以得到所述報告章節文本樣本所屬的編制差錯類型,包括:
12、將所述審核問題差錯特征、所述編制關注點差錯特征、所述編制指南差錯特征和所述編制規范差錯特征分別輸入至一個所述全連接網絡,以分別預測所述報告章節文本樣本是否屬于所述四種類型的編制差錯。
13、可選地,所述基于預測的所述報告章節文本樣本所屬的編制差錯類型以及所述報告章節文本樣本的標注編制差錯類型,構建損失函數,包括:
14、構建損失函數:
15、其中, l為損失值; yc為所述報告章節文本樣本針對第 c種編制差錯類型的標簽值,為所述報告章節文本樣本針對第 c種編制差錯類型的預測的概率, c為編制差錯類型的類型集合,ac為第 c種編制差錯類型的權重系數。
16、可選地,所述基于所述損失函數對所述待訓練的防差錯分類模型進行訓練,得到預訓好的所述防差錯分類模型,包括:在每次基于所述損失函數對所述待訓練的防差錯分類模型進行網絡參數訓練時,以當次所述報告章節文本樣本對應的標注編制差錯類型所對應的特征分支網絡和全連接網絡作為訓練網絡,其他網絡作為非訓練網絡;保持所述非訓練網絡不動,利用所述損失值對所述訓練網絡進行網絡參數調整,以完成本次網絡參數訓練。
17、可選地,根據所述報告章節文本所屬的目標編制差錯類型,生成并輸出防差錯提醒信息,包括:根據所述報告章節文本所屬的目標編制差錯類型,將所述報告章節文本與所述目標編制差錯類型對應的編制差錯示例庫中的差錯示例文本進行匹配,得到所述報告章節文本中與所述目標編制差錯類型對應的第一差錯文本;
18、基于預置的更正文本庫生成所述第一差錯文本對應的第一更正文本,并將所述第一差錯文本和所述第一更正文本作為提醒信息進行輸出。
19、可選地,在所述將所述第一差錯文本和所述第一更正文本作為提醒信息進行輸出之后,所述方法還包括:接收報告編制者根據所述提醒信息對所述報告章節文本進行更正后所形成的第二更正文本,并將所述第一差錯文本作為一個差錯示例文本存儲至與所述目標編制差錯類型對應的編制差錯示例庫中,以及將所述第二更正文本存儲至所述更正文本庫中。
20、第二方面,本申請還提供一種報告編制防差錯處理裝置,包括:
21、獲取模塊,用于獲取待審核的報告章節文本;
22、預測模塊,用于將所述報告章節文本輸入至預訓練的防差錯分類模型中,輸出得到所述報告章節文本所屬的目標編制差錯類型;所述防差錯分類模型用于一次性輸出所述報告章節文本是否屬于如下四種類型的編制差錯:審核問題差錯、編制關注點差錯、編制指南差錯和編制規范差錯;
23、提醒模塊,用于根據所述報告章節文本所屬的目標編制差錯類型,生成并輸出防差錯提醒信息。
24、第三方面,本申請還提供一種電子設備,包括存儲器和處理器,所述存儲器上存儲有計算機程序,所述計算機程序被所述處理器執行時,實現如第一方面所述的報告編制防差錯處理方法。
25、第四方面,本申請還提供一種存儲介質,所述存儲介質存儲有計算機程序,所述存儲介質被一個或多個處理器執行時,實現如第一方面所述的報告編制防差錯處理方法。
26、本申請提供的報告編制防差錯處理方法、裝置、電子設備及存儲介質,通過獲取待審核的報告章節文本;將報告章節文本輸入至預訓練的防差錯分類模型中,輸出得到報告章節文本所屬的目標編制差錯類型;該防本文檔來自技高網...
【技術保護點】
1.一種報告編制防差錯處理方法,其特征在于,包括:
2.根據權利要求1所述的報告編制防差錯處理方法,其特征在于,訓練所述防差錯分類模型的過程,包括:
3.根據權利要求2所述的報告編制防差錯處理方法,其特征在于,所述特征提取層包括審核問題分支網絡、編制關注點分支網絡、編制指南分支網絡和編制規范分支網絡;所述全連接層包括四個獨立的全連接網絡;
4.根據權利要求3所述的報告編制防差錯處理方法,其特征在于,所述基于預測的所述報告章節文本樣本所屬的編制差錯類型以及所述報告章節文本樣本的標注編制差錯類型,構建損失函數,包括:
5.根據權利要求4所述的報告編制防差錯處理方法,其特征在于,所述基于所述損失函數對所述待訓練的防差錯分類模型進行訓練,得到預訓好的所述防差錯分類模型,包括:
6.根據權利要求1所述的報告編制防差錯處理方法,其特征在于,根據所述報告章節文本所屬的目標編制差錯類型,生成并輸出防差錯提醒信息,包括:
7.根據權利要求6所述的報告編制防差錯處理方法,其特征在于,在所述將所述第一差錯文本和所述第一更正文本作為
8.一種報告編制防差錯處理裝置,其特征在于,包括:
9.一種存儲介質,其特征在于,所述存儲介質存儲有計算機程序,所述存儲介質被一個或多個處理器執行時,實現如權利要求1-7中任意一項所述的報告編制防差錯處理方法。
10.一種電子設備,其特征在于,包括存儲器和處理器,所述存儲器上存儲有計算機程序,所述計算機程序被所述處理器執行時,實現如權利要求1-7中任意一項所述的報告編制防差錯處理方法。
...【技術特征摘要】
1.一種報告編制防差錯處理方法,其特征在于,包括:
2.根據權利要求1所述的報告編制防差錯處理方法,其特征在于,訓練所述防差錯分類模型的過程,包括:
3.根據權利要求2所述的報告編制防差錯處理方法,其特征在于,所述特征提取層包括審核問題分支網絡、編制關注點分支網絡、編制指南分支網絡和編制規范分支網絡;所述全連接層包括四個獨立的全連接網絡;
4.根據權利要求3所述的報告編制防差錯處理方法,其特征在于,所述基于預測的所述報告章節文本樣本所屬的編制差錯類型以及所述報告章節文本樣本的標注編制差錯類型,構建損失函數,包括:
5.根據權利要求4所述的報告編制防差錯處理方法,其特征在于,所述基于所述損失函數對所述待訓練的防差錯分類模型進行訓練,得到預訓好的所述防差錯分類模型,包括:
【專利技術屬性】
技術研發人員:譚雅瓊,宋靜剛,莊園,謝風,唐寧霽,
申請(專利權)人:中國神華能源股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。