System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及電數字數據處理,特別涉及一種智能生成差錯分析文檔方法及系統、存儲介質。
技術介紹
1、在文檔編輯工作中,例如通過文檔的方式生產書籍、報紙、網頁等產品時,由于文檔的生成和編輯絕大部分都依賴人工操作,因此在編輯過程中難免會發生差錯,例如出現錯別字、標點符號等形式差錯,甚至還會出現一些實質性的差錯。對于差錯的管理,一是通過編輯文檔的人員自檢,二是通過質檢人員檢查。由于編輯文檔的人員存在一定的思維定式,即使花費了一定的時間進行自檢,其檢查通過后的文檔中仍然可能存在一些差錯,因此質檢人員的作用就很重要。
2、目前,質檢人員在檢查文檔時,會通讀整個文檔,然后逐個識別差錯,并以批注的形式將差錯標出,形成帶有批注的文檔,最后對所有的批注進行統計分析,歸納文檔中出現的差錯類型、數量等信息,形成差錯分析表。該差錯分析表將反饋給文檔編輯人員,達到提醒和激勵文檔編輯人員的效果。
3、采用上述方法時,由于質檢人員對于文檔中批注的統計都是人工進行的,因此存在效率低下的問題。
技術實現思路
1、本申請實施例提供了一種智能生成差錯分析文檔方法及系統、存儲介質,用以解決現有技術中質檢人員采用人工處理方式存在的效率低和漏檢的問題。
2、一方面,本申請實施例提供了一種智能生成差錯分析文檔方法,包括:
3、獲取原始文檔;
4、識別原始文檔中的差錯,在原始文檔中與識別到的差錯對應的位置設置批注,形成第一含批注文檔;
5、獲取質檢人員在第一含批
6、采用差錯分類模型對第二含批注文檔中具有簡單描述的批注進行分類,確定具有簡單描述的批注對應的具有詳細描述的批注,將具有詳細描述的批注的內容添加在具有簡單描述的批注中,形成修改后的第二含批注文檔;
7、獲取修改后的第二含批注文檔中的批注內容,并提取批注內容中的差錯信息;
8、對差錯信息進行統計,形成差錯分析文檔。
9、另一方面,本申請實施例還提供了一種智能生成差錯分析文檔系統,包括:
10、文檔獲取模塊,用于獲取原始文檔;
11、第一批注模塊,用于識別原始文檔中的差錯,在原始文檔中與識別到的差錯對應的位置設置批注,形成第一含批注文檔;
12、第二批注模塊,用于獲取質檢人員在第一含批注文檔中添加的批注,形成第二含批注文檔;
13、文檔修改模塊,用于采用差錯分類模型對第二含批注文檔中具有簡單描述的批注進行分類,確定具有簡單描述的批注對應的具有詳細描述的批注,將具有詳細描述的批注的內容添加在具有簡單描述的批注中,形成修改后的第二含批注文檔;
14、批注提取模塊,用于獲取修改后的第二含批注文檔中的批注內容,并提取批注內容中的差錯信息;
15、差錯分析模塊,用于對差錯信息進行統計,形成差錯分析文檔。
16、另一方面,本申請實施例還提供了一種計算機存儲介質,該計算機存儲介質中存儲有多條計算機指令,該多條計算機指令用于使計算機執行上述的方法。
17、本申請中的一種智能生成差錯分析文檔方法及系統、存儲介質,具有以下優點:
18、對批注進行智能化識別,提取批注中的差錯信息,對差錯信息進行統計,使質檢人員免去了在批注統計上的經歷投入,大大提高了處理的效率。
本文檔來自技高網...【技術保護點】
1.一種智能生成差錯分析文檔方法,其特征在于,包括:
2.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,識別所述原始文檔中的差錯為錯別字,在識別錯別字時,將所述原始文檔中的每一個句子劃分為多個真實分詞,將每個所述真實分詞轉換為相應的詞向量,根據每個所述真實分詞以外的其他分詞的詞向量得到預測分詞,確定所述預測分詞的詞向量和真實分詞的詞向量的距離,根據所述距離確定所述真實分詞是否存在錯別字。
3.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,識別所述原始文檔中的差錯為錯別字,在識別錯別字時,將所述原始文檔中的每一個句子劃分為多個真實分詞,將每個所述真實分詞與字典中的標準分詞進行比較,根據比較結果確定所述真實分詞是否存在錯別字。
4.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,在獲取質檢人員在所述第一含批注文檔中添加的批注后,還對添加的批注進行分析,確定添加的批注是否正確,在添加的批注不正確時,向質檢人員發送提醒信息。
5.根據權利要求4所述的一種智能生成差錯分析文檔方法,其特征在于,對添
6.根據權利要求4所述的一種智能生成差錯分析文檔方法,其特征在于,在統計所述差錯信息時,還對質檢人員添加的批注出現差錯的情況進行統計。
7.根據權利要求6所述的一種智能生成差錯分析文檔方法,其特征在于,在對質檢人員添加的批注出現差錯的情況進行統計時,還按照添加批注的質檢人員對批注出現差錯的情況分別進行統計。
8.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,在對所述差錯信息進行統計時,提取所述差錯信息中的關鍵詞,將所述關鍵詞與標準信息進行比對,確定所述差錯信息所屬的差錯類型,對涉及相同所述差錯類型的所述差錯信息進行統計。
9.一種智能生成差錯分析文檔系統,其特征在于,包括:
10.一種計算機存儲介質,其特征在于,所述計算機存儲介質中存儲有多條計算機指令,所述多條計算機指令用于使計算機執行權利要求1-8任一項所述的方法。
...【技術特征摘要】
1.一種智能生成差錯分析文檔方法,其特征在于,包括:
2.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,識別所述原始文檔中的差錯為錯別字,在識別錯別字時,將所述原始文檔中的每一個句子劃分為多個真實分詞,將每個所述真實分詞轉換為相應的詞向量,根據每個所述真實分詞以外的其他分詞的詞向量得到預測分詞,確定所述預測分詞的詞向量和真實分詞的詞向量的距離,根據所述距離確定所述真實分詞是否存在錯別字。
3.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,識別所述原始文檔中的差錯為錯別字,在識別錯別字時,將所述原始文檔中的每一個句子劃分為多個真實分詞,將每個所述真實分詞與字典中的標準分詞進行比較,根據比較結果確定所述真實分詞是否存在錯別字。
4.根據權利要求1所述的一種智能生成差錯分析文檔方法,其特征在于,在獲取質檢人員在所述第一含批注文檔中添加的批注后,還對添加的批注進行分析,確定添加的批注是否正確,在添加的批注不正確時,向質檢人員發送提醒信息。
5.根據權利要求4所述的一種智能生成差錯分析文檔方法,...
【專利技術屬性】
技術研發人員:張歲平,王路,
申請(專利權)人:陜西巨微圖書文化傳播有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。