基于Transformer模型融合關鍵信息的神經機器翻譯模型制造技術

技術編號：29021685 閱讀：23 留言：0更新日期：2021-06-26 05:22

本發明專利技術公開了基于Transformer模型融合關鍵信息的神經機器翻譯模型，屬于自然語言處理技術領域，所述神經機器翻譯模型包括用于關鍵信息編碼的第一編碼模塊、用于源語言文本編碼的第二編碼模塊、第一多頭注意力編碼層和解碼器，第一多頭注意力編碼層對第一編碼模塊輸出的關鍵信息編碼結果和第二編碼模塊輸出的源語言文本編碼結果進行信息融合，并將信息融合的結果與第二編碼模塊輸出的源語言文本編碼結果經拼接處理后輸入解碼器，以將關鍵信息與源語言文本進行關聯，使關鍵信息融入至Transformer模型，以此更加準確提取關鍵詞特征，進而提高關鍵詞的翻譯準確度，大大降低關鍵詞漏譯的問題。鍵詞漏譯的問題。鍵詞漏譯的問題。

全部詳細技術資料下載

【技術實現步驟摘要】
基于Transformer模型融合關鍵信息的神經機器翻譯模型

[0001]本專利技術涉及自然語言處理
，尤其涉及基于Transformer模型融合關鍵信息的神經機器翻譯模型。

技術介紹

[0002]機器翻譯任務是NLP(Natural Language Processing，自然語言處理)領域中一個重要研究熱點，它可以幫助人們完成源語言到目標語言的翻譯工作，從而逐漸代替人類完成復雜且費時費力的翻譯工作。盡管機器的翻譯結果不一定有專業人員翻譯準確，但是它的翻譯結果已足以滿足人們正常使用。
[0003]早在上個世紀三四十年代人們就開始了有關機器翻譯的研究，隨著研究的不斷突破，機器翻譯技術研究也漸漸從翻譯系統(基于詞匯、語法等規則)轉變為基于統計學的機器翻譯，再到現在研究火熱的神經機器翻譯(NMT)。神經機器翻譯的任務主要是利用神經網絡相關技術及大量的數據來訓練得到一個通用的翻譯模型。模型訓練好以后，我們只需給定模型輸入源語言句子，模型通過運行計算即可得到對應的翻譯結果。seq2seq結構在神經機器翻譯中具備一定的優勢，seq2seq模型極大地促進了神經機器翻譯模型的研究進展。因此，近幾年關于神經機器翻譯模型的研究大多都基于該結構。2017年，Vaswani等人提出了Transformer模型，該模型相較于seq2seq在NMT中擁有更好的實驗表現。
[0004]盡管當下的神經機器翻譯模型的翻譯結果都還不錯，但是對于關鍵信息的翻譯依然存在錯譯、漏譯等情況，而翻譯過程中最重要的就是對于關鍵信息的翻譯，因...

【技術保護點】

【技術特征摘要】
1.基于Transformer模型融合關鍵信息的神經機器翻譯模型，其特征在于：所述神經機器翻譯模型包括用于關鍵信息編碼的第一編碼模塊、用于源語言文本編碼的第二編碼模塊、第一多頭注意力編碼層和解碼器，第一多頭注意力編碼層對第一編碼模塊輸出的關鍵信息編碼結果和第二編碼模塊輸出的源語言文本編碼結果進行信息融合，并將所述信息融合的結果與第二編碼模塊輸出的源語言文本編碼結果經拼接處理后輸入解碼器，所述解碼器輸出翻譯結果。2.根據權利要求1所述的基于Transformer模型融合關鍵信息的神經機器翻譯模型，其特征在于：所述信息融合具體為：將源語言文本的編碼結果作為輸入矩陣Q、關鍵信息的編碼結果作為輸入矩陣K和輸入矩陣V進行多頭注意力計算。3.根據權利要求1所述的基于Transformer模型融合關鍵信息的神經機器翻譯模型，其特征在于：所述第一編碼模塊包括順次連接的第二多頭注意力編碼層、第一前饋神經網絡，關鍵信息的詞向量矩陣輸入至第二多頭注意力編碼層，第一前饋神經網絡輸出端與第一多頭注意力編碼層連接。4.根據權利要求3所述的基于Transformer模型融合關鍵信息的神經機器翻譯模型，其特征在于：所述第二編碼模塊包括順次連接的第三多頭注意力編碼層、第二前饋神經網絡，源語言文本的詞向量矩陣輸入至第三多頭注意力編碼層，第二前饋神經網絡輸出端與第一多頭注意力編碼層連接。5.根據權利要求4所述的基于Transformer模型融合關鍵信息的神經機器翻譯模型，其特征在于：所述第二多頭注意力編碼與第一前饋神經網絡之間經第一殘差與歸一化層連接，和/或第一前饋神經網絡與第一多頭注意力編碼層之間經第二殘差與歸一化層連接；第一殘差與歸一化層的輸入端與第二多頭注意力編碼的輸入端、第二多頭注意力編碼的輸出端連接，第二殘差與歸一化層的輸入端與第一前饋神經網絡的輸入端、第一前饋神經網絡的輸出端連接；第三多頭注意力編碼與第...

【專利技術屬性】
技術研發人員：鄭德生，胡世杰，彭宇，胡孫強，向文嘉，張秀容，溫冬，
申請(專利權)人：西南石油大學，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術

<li id="yeygw"></li>