【技術實現步驟摘要】
文本語義理解方法、裝置和系統
本申請涉及自然語言理解
,尤其涉及一種文本語義理解方法、裝置和系統。
技術介紹
作為人工智能領域中重要方向之一的自然語言理解技術,一直是相關領域研究人員研究的熱點。特別是近年來,隨著移動互聯網技術的迅速發展,信息化程度日益提高,人們越發渴望能讓機器理解自然語言,從而實現減少人工投入、海量數據共享等目標。相關技術中,主流方法是基于循環神經網絡的文本語義理解方法和基于卷積神經網絡的文本語義理解方法。但是,通常的循環神經網絡和卷積神經網絡都難以優化,具體而言,如果不增加深度,文本語義理解效果較差,而如果增加深度,訓練和優化的錯誤率就會增加,難以得到準確的訓練模型,從而語義理解錯誤率也較高。因此,相關技術中的文本語義理解方法的效果并不理想。
技術實現思路
本申請旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本申請的一個目的在于提出一種文本語義理解方法,該方法可以提升文本語義理解效果。本申請的另一個目的在于提出一種文本語義理解裝置。本申請的另一個目的在于提出一種文本語義理解系統。為達到上述目的,本申請第一方面實施例提出的文本語義理解方法,包括:接收待語義理解的文本;根據預先構建的深度殘差網絡模型,對所述待語義理解的文本進行語義理解,得到語義理解結果。為達到上述目的,本申請第二方面實施例提出的文本語義理解裝置,包括:接收模塊,用于接收待語義理解的文本;語義理解模塊,用于根據預先構建的深度殘差網絡模型,對所述待語義理解的文本進行語義理解,得到語義理解結果。為達到上述目的,本申請第三方面實施例提出的文本語義理解系統,包括:客戶端, ...
【技術保護點】
一種文本語義理解方法,其特征在于,包括:接收待語義理解的文本;根據預先構建的深度殘差網絡模型,對所述待語義理解的文本進行語義理解,得到語義理解結果。
【技術特征摘要】
1.一種文本語義理解方法,其特征在于,包括:接收待語義理解的文本;根據預先構建的深度殘差網絡模型,對所述待語義理解的文本進行語義理解,得到語義理解結果。2.根據權利要求1所述的方法,其特征在于,對所述待語義理解的文本進行語義理解之前,所述方法還包括:對所述待語義理解的文本進行預處理。3.根據權利要求2所述的方法,其特征在于,還包括:構建深度殘差網絡模型,所述構建深度殘差網絡模型,包括:收集訓練文本,并對所述訓練文本進行預處理,以及,獲取所述訓練文本的標注信息,所述標注信息包括語義理解結果;確定深度殘差網絡模型的拓撲結構;基于預處理后的訓練文本、所述標注信息和所述拓撲結構進行模型訓練,構建得到深度殘差網絡模型。4.根據權利要求3所述的方法,其特征在于,當存在多任務時,所述模型訓練基于多任務同步處理機制進行。5.根據權利要求4所述的方法,其特征在于,所述模型訓練時,通過對整體損失函數進行最小化確定模型參數,其中,所述整體損失函數為各個任務的損失函數的線性加權函數。6.根據權利要求1所述的方法,其特征在于,所述深度殘差網絡模型的拓撲結構中包括:輔助輸入層,所述輔助輸入層用于輸入先驗信息。7.根據權利要求6所述的方法,其特征在于,所述輔助輸入層包括:輸入部分,用于輸入先驗信息,并對先驗信息進行向量化;變換部分,用于對向量化后的先驗信息進行向量變換。8.根據權利要求1所述的方法,其特征在于,所述深度殘差網絡模型的拓撲結構中包括:注意力層,所述注意力層包括:非線性變換部分,用于對輸入矩陣進行非線性變換,得到非線性變換后的矩陣,所述輸入矩陣由各個詞組的詞向量組成;權重控制部分,用于采用預設向量分別與非線性變換后的矩陣中的各個詞組的詞向量做內積,得到控制向量;權重分配部分,用于對所述控制向量進行權重分配,得到權重向量;組合部分,用于采用所述權重向量對所述輸入矩陣中不同詞組的詞向量進行線性組合,得到注意力層的輸出。9.根據權利要求1所述的方法,其特征在于,所述深度殘差網絡模型的拓撲結構中包括:殘差單元層,所述殘差單元層包括卷積層級聯部分和捷徑部分,所述卷積層級聯部分包括多個相互級聯的卷積層,所述捷徑部分用于將輸入直接或對輸入進行線性變換后與卷積層級聯部分的輸出相加,再對相加后的值進行激活。10.一種文本語義理解裝置,其特征在于,包括:接收模塊,用于接收待語義理解的文本;語義理解模塊,用于根據預先構建的深度殘差網絡模型,對所述待語義理解的文本進行語義理解,得...
【專利技術屬性】
技術研發人員:劉也寬,胡加學,孫勝杰,王震,
申請(專利權)人:科大訊飛股份有限公司,
類型:發明
國別省市:安徽,34
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。