System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及自然語言處理,尤其涉及一種翻譯質量評估方法、裝置、電子設備和存儲介質。
技術介紹
1、隨著經濟全球化的發(fā)展,翻譯需求顯著增加。翻譯質量評估成為確保信息準確傳達的關鍵環(huán)節(jié)。在實際翻譯工作中,需要對譯文的質量進行評估檢查。傳統(tǒng)的質量評估方法依賴人工審校,既耗時又對審校者的語言能力要求極高,這種方法不僅效率低,而且容易受到主觀判斷的影響。
技術實現思路
1、本專利技術提供一種翻譯質量評估方法、裝置、電子設備和存儲介質,用以解決現有技術中采用人工的方式對翻譯質量進行評估,效率低、準確性易受主觀因素影響的缺陷。
2、第一方面,本專利技術提供一種翻譯質量評估方法,包括:
3、獲取目標文檔數據,所述目標文檔數據包括原文、所述原文對應的譯文和所述原文對應的標準譯文;
4、對所述目標文檔數據進行解析,得到多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子;
5、將所述多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子輸入至預先構建的翻譯質量評估模型,得到所述翻譯質量評估模型輸出的所述原文對應的譯文的翻譯質量評估結果;
6、其中,所述翻譯質量評估模型是基于樣本原文的多個樣本原文句子、所述多個樣本原文句子對應的多個樣本譯文句子和多個樣本標準譯文句子,以及所述樣本原文對應的樣本譯文的翻譯質量評估結果標簽進行訓練得到的。
7、在一些實施例中,所述翻譯質量評估模型包括錯誤檢查層、漏譯檢
8、在一些實施例中,所述將所述多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子輸入至預先構建的翻譯質量評估模型,得到所述翻譯質量評估模型輸出的所述原文對應的譯文的翻譯質量評估結果,包括:
9、將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述錯誤檢查層,得到所述錯誤檢查層輸出的所述每一原文句子對應的譯文句子的錯誤檢查結果;
10、將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述漏譯檢查層,得到所述漏譯檢查層輸出的所述每一原文句子對應的譯文句子的漏譯檢查結果;
11、將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述相似度檢查層,得到所述相似度檢查層輸出的所述每一原文句子對應的譯文句子的相似度檢查結果;
12、基于所述每一原文句子對應的譯文句子的錯誤檢查結果、所述每一原文句子對應的譯文句子的漏譯檢查結果和所述每一原文句子對應的譯文句子的相似度檢查結果,得到所述原文對應的譯文的翻譯質量評估結果。
13、在一些實施例中,所述將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述錯誤檢查層,得到所述錯誤檢查層輸出的所述每一原文句子對應的譯文句子的錯誤檢查結果,包括:
14、將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述錯誤檢查層;
15、基于所述錯誤檢查層,對所述每一原文句子對應的譯文句子的低級錯誤、語法錯誤和表達錯誤進行檢查,得到所述每一原文句子對應的譯文句子的錯誤檢查結果;
16、其中,所述錯誤檢查結果包括:低級錯誤檢查結果、語法錯誤檢查結果和表達錯誤檢查結果。
17、在一些實施例中,所述基于所述每一原文句子對應的譯文句子的錯誤檢查結果、所述每一原文句子對應的譯文句子的漏譯檢查結果和所述每一原文句子對應的譯文句子的相似度檢查結果,得到所述原文對應的譯文的翻譯質量評估結果,包括:
18、基于所述每一原文句子對應的譯文句子的錯誤檢查結果,得到所述原文對應的譯文的錯誤檢查項的得分;
19、基于所述每一原文句子對應的譯文句子的漏譯檢查結果,得到所述原文對應的譯文的漏譯檢查項的得分;
20、基于所述每一原文句子對應的譯文句子的相似度檢查結果,得到所述原文對應的譯文與標準譯文的相似度檢查項的得分。
21、在一些實施例中,所述原文對應的譯文的翻譯質量評估結果包括:所述譯文的總得分、所述譯文的多個檢查項的得分、每一譯文句子的得分和說明;所述多個檢查項包括:低級錯誤、語法錯誤、表達錯誤、漏譯和與標準譯文句子的相似度。
22、在一些實施例中,所述翻譯質量評估模型的確定過程包括:
23、獲取樣本文檔數據,所述樣本文檔數據包括樣本原文、所述樣本原文對應的樣本譯文和所述樣本原文對應的標準譯文;
24、對所述樣本文檔數據進行解析,得到多個樣本原文句子、所述多個樣本原文句子對應的多個樣本譯文句子和多個樣本標準譯文句子;
25、確定所述樣本原文對應的樣本譯文的翻譯質量評估結果標簽;
26、以所述多個樣本原文句子、所述多個樣本原文句子對應的多個樣本譯文句子和多個樣本標準譯文句子為樣本數據,以所述樣本原文對應的樣本譯文的翻譯質量評估結果標簽為樣本標簽,訓練初始翻譯質量評估模型;
27、對所述初始翻譯質量評估模型的參數進行迭代優(yōu)化,訓練完成后,得到所述翻譯質量評估模型。
28、第二方面,本專利技術還提供一種翻譯質量評估裝置,包括:
29、獲取單元,用于獲取目標文檔數據,所述目標文檔數據包括原文、所述原文對應的譯文和所述原文對應的標準譯文;
30、解析單元,用于對所述目標文檔數據進行解析,得到多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子;
31、評估單元,用于將所述多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子輸入至預先構建的翻譯質量評估模型,得到所述翻譯質量評估模型輸出的所述原文對應的譯文的翻譯質量評估結果;
32、其中,所述翻譯質量評估模型是基于樣本原文的多個樣本原文句子、所述多個樣本原文句子對應的多個樣本譯文句子和多個樣本標準譯文句子,以及所述樣本原文對應的樣本譯文的翻譯質量評估結果標簽進行訓練得到的。
33、第三方面,本專利技術還提供一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現如上述任一種所述翻譯質量評估方法。
34、第四方面,本專利技術還提供一種非暫態(tài)計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現如上述任一種所述翻譯質量評估方法。
35、本專利技術提供的翻譯質量評估方法、裝置、電子設備和存儲介質,通過獲取目標文檔數據,對目標文檔數據進行解析,得到多個原文句本文檔來自技高網...
【技術保護點】
1.一種翻譯質量評估方法,其特征在于,包括:
2.根據權利要求1所述的翻譯質量評估方法,其特征在于,所述翻譯質量評估模型包括錯誤檢查層、漏譯檢查層和相似度檢查層;所述錯誤檢查層用于檢查每一原文句子對應的譯文句子的翻譯錯誤,所述漏譯檢查層用于檢查所述每一原文句子對應的譯文句子的漏譯情況,所述相似度檢查層用于檢查所述每一原文句子對應的譯文句子與所述每一原文句子對應的標準譯文句子的相似度。
3.根據權利要求2所述的翻譯質量評估方法,其特征在于,所述將所述多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子輸入至預先構建的翻譯質量評估模型,得到所述翻譯質量評估模型輸出的所述原文對應的譯文的翻譯質量評估結果,包括:
4.根據權利要求3所述的翻譯質量評估方法,其特征在于,所述將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述錯誤檢查層,得到所述錯誤檢查層輸出的所述每一原文句子對應的譯文句子的錯誤檢查結果,包括:
5.根據權利要求3所述的翻譯質量評估方法,其特征在于,所述基于所述每一原文
6.根據權利要求2-5任一項所述的翻譯質量評估方法,其特征在于,所述原文對應的譯文的翻譯質量評估結果包括:所述譯文的總得分、所述譯文的多個檢查項的得分、每一譯文句子的得分和說明;所述多個檢查項包括:低級錯誤、語法錯誤、表達錯誤、漏譯和與標準譯文句子的相似度。
7.根據權利要求1所述的翻譯質量評估方法,其特征在于,所述翻譯質量評估模型的確定過程包括:
8.一種翻譯質量評估裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現如權利要求1至7任一項所述翻譯質量評估方法。
10.一種非暫態(tài)計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現如權利要求1至7任一項所述翻譯質量評估方法。
...【技術特征摘要】
1.一種翻譯質量評估方法,其特征在于,包括:
2.根據權利要求1所述的翻譯質量評估方法,其特征在于,所述翻譯質量評估模型包括錯誤檢查層、漏譯檢查層和相似度檢查層;所述錯誤檢查層用于檢查每一原文句子對應的譯文句子的翻譯錯誤,所述漏譯檢查層用于檢查所述每一原文句子對應的譯文句子的漏譯情況,所述相似度檢查層用于檢查所述每一原文句子對應的譯文句子與所述每一原文句子對應的標準譯文句子的相似度。
3.根據權利要求2所述的翻譯質量評估方法,其特征在于,所述將所述多個原文句子,以及所述多個原文句子對應的多個譯文句子和多個標準譯文句子輸入至預先構建的翻譯質量評估模型,得到所述翻譯質量評估模型輸出的所述原文對應的譯文的翻譯質量評估結果,包括:
4.根據權利要求3所述的翻譯質量評估方法,其特征在于,所述將每一原文句子、所述每一原文句子對應的譯文句子和所述每一原文句子對應的標準譯文句子輸入至所述錯誤檢查層,得到所述錯誤檢查層輸出的所述每一原文句子對應的譯文句子的錯誤檢查結果,包括:
5.根據權利要求3所述的翻譯質量評估方法,其特征在于,所述基...
【專利技術屬性】
技術研發(fā)人員:王光俊,
申請(專利權)人:語聯(lián)網武漢信息技術有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。