System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及語音識別,尤其涉及基于偏移和卷積自適應的非母語中文語音識別方法與系統。
技術介紹
1、針對現有非母語口音數據稀缺、并且目前大多數模型的訓練數據是以母語為主的標準發音,導致模型對非母語學習者的不同口音缺乏適應性。低資源語音識別是指在數據資源有限的情況下進行的語音識別研究。通常涉及到非主流語言或方言,其標注數據稀缺,難以用于訓練強大的語音識別系統。?在這種背景下,研究者們嘗試使用各種技術,如遷移學習、多任務學習、自監督學習等來提高系統的性能。例如,預訓練模型如?wav2vec?2.0?和hubert?已經在多語言環境中顯示出其對低資源語音識別的顯著改進。
2、在低資源口音語音識別任務中,自監督預訓練模型的微調可以帶來性能提升。然而,傳統的微調方法在計算資源上成本較高,且難以適應多任務學習場景,如個性化?asr。為了解決這些問題,自適應微調方法應運而生。自適應微調通過在預訓練編碼器的各層之間插入輕量級的自適應模塊,并僅更新這些模塊的參數,從而避免了對編碼器參數的大規模修改。
技術實現思路
1、本專利技術的目的在于解決現有技術中的問題。
2、本專利技術解決其技術問題所采用的技術方案是:提供一種基于偏移和卷積自適應的非母語中文語音識別方法,包括以下步驟:
3、選擇預訓練模型構建非母語中文語音識別模型;
4、采用選擇性訓練的方式訓練非母語中文語音識別模型;
5、利用訓練好的非母語中文語音識別模型實現非母語中文語音識別;<
...【技術保護點】
1.一種基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述選擇預訓練模型構建非母語中文語音識別模型,包括以下步驟:
3.根據權利要求2所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述自注意力子層將輸入信號轉換為語音幀,具體為:輸入信號經過自注意力子層后的輸出,通過殘差連接再與輸入信號相加,再進行層歸一化,得到語音幀,表示第i個語音幀片段,表示語音幀片段數量。
4.根據權利要求2所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述TBA模塊根據語音幀生成重要性權重和偏置項并輸出偏置向量到前饋層,具體為:
5.根據權利要求2所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述卷積自適應模塊將表示向量轉換為特征加權向量,包括以下步驟:
6.根據權利要求5所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述壓縮激發模塊獲得特征加權向量的過程,包括以下步驟
7.根據權利要求5所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述采用選擇性訓練的方式訓練非母語中文語音識別模型,具體為:只訓練TBA模塊和卷積自適應層的參數,同時凍結預訓練模型的參數;
8.根據權利要求1所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述利用訓練好的非母語中文語音識別模型實現非母語中文語音識別,包括以下步驟:
9.一種基于偏移和卷積自適應的非母語中文語音識別系統,其特征在于,包括:
...【技術特征摘要】
1.一種基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述選擇預訓練模型構建非母語中文語音識別模型,包括以下步驟:
3.根據權利要求2所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述自注意力子層將輸入信號轉換為語音幀,具體為:輸入信號經過自注意力子層后的輸出,通過殘差連接再與輸入信號相加,再進行層歸一化,得到語音幀,表示第i個語音幀片段,表示語音幀片段數量。
4.根據權利要求2所述的基于偏移和卷積自適應的非母語中文語音識別方法,其特征在于,所述tba模塊根據語音幀生成重要性權重和偏置項并輸出偏置向量到前饋層,具體為:
5.根據權利要求2所述的基于偏移和卷...
【專利技術屬性】
技術研發人員:周浩,王華珍,陳建國,馬賀陽,戴朝,
申請(專利權)人:華僑大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。