System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 成人免费一区二区无码视频,国产成人无码精品久久久小说,91久久精品无码一区二区毛片
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    口音語音識別模型的訓練方法、語音識別方法、裝置和計算機設備制造方法及圖紙

    技術編號:44454054 閱讀:3 留言:0更新日期:2025-02-28 18:59
    本申請涉及一種口音語音識別模型的訓練方法、語音識別方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。方法包括:獲取樣本集;樣本集包括多種第一樣本口音語音數據和第一樣本口音語音數據對應的口語語音標簽;將第一樣本口音語音數據輸入至預訓練的微調語音模型的編碼單元,輸出攜帶有口音信息的第一樣本語音特征;將第一樣本口音語音數據輸入至待訓練的口音語音識別模型的編碼單元,輸出第二樣本語音特征;將第一樣本語音特征和第二樣本語音特征融合,得到融合后的樣本語音特征;根據融合后的樣本語音特征對待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型。采用本方法能夠提高語音識別的準確性。

    【技術實現步驟摘要】

    本申請涉及人工智能,特別是涉及一種口音語音識別模型的訓練方法、語音識別方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。


    技術介紹

    1、隨著人工智能與深度神經網絡的迅猛發展,語音識別技術正迎來廣泛的應用和普及,從語音助手到客戶服務,從醫療記錄到智能家居,這一技術正在不斷改善我們的日常生活和工作方式。語音識別技術是一種將口語語音轉化為文本或指令的計算機應用技術。它使用各種算法和模型,以自動識別和理解說話者的語音內容。

    2、而自動語音識別技術在實際應用中,常常會面臨重口音或方言輸入的挑戰。

    3、由于不同口音之間的發音變化的多樣性以及特定口音自動語音識別的監督訓練數據的稀缺性,相關技術中在處理不同口音語音時仍然可能失敗,導致語音識別的準確性下降。

    4、因此,相關技術中存在著語音識別的準確性較低的問題。


    技術實現思路

    1、基于此,有必要針對上述技術問題,提供一種能夠提高語音識別的準確性的口音語音識別模型的訓練方法、語音識別方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。

    2、第一方面,本申請提供了一種口音語音識別模型的訓練方法,包括:

    3、獲取樣本集;所述樣本集包括多種第一樣本口音語音數據和所述第一樣本口音語音數據對應的口語語音標簽;

    4、將所述第一樣本口音語音數據輸入至預訓練的微調語音模型的編碼單元,輸出攜帶有口音信息的第一樣本語音特征;所述預訓練的微調語音模型為采用攜帶有第一口音類別標簽的第二樣本口音語音數據,對預訓練的通用語音模型進行微調得到的;

    5、將所述第一樣本口音語音數據輸入至待訓練的口音語音識別模型的編碼單元,輸出第二樣本語音特征;

    6、將所述第一樣本語音特征和所述第二樣本語音特征融合,得到融合后的樣本語音特征;

    7、根據所述融合后的樣本語音特征對所述待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型;所述預訓練的口音語音識別模型用于對輸入的語音數據進行語音識別。

    8、在其中一個實施例中,所述待訓練的口音語音識別模型還包括解碼單元,所述口語語音標簽包括真實語音文本內容;所述根據所述融合后的樣本語音特征對所述待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型,包括:

    9、將所述融合后的樣本語音特征輸入至所述解碼單元,得到樣本語音識別結果;

    10、根據所述樣本語音識別結果和所述真實語音文本內容之間的差異,對所述待訓練的口音語音識別模型的模型參數進行調整,直至調整后的所述待訓練的口音語音識別模型滿足預設的訓練結束條件,得到所述預訓練的口音語音識別模型。

    11、在其中一個實施例中,所述待訓練的口音語音識別模型的訓練方式采用遷移學習訓練方式,所述待訓練的口音語音識別模型還包括口音分類單元,所述口語語音標簽還包括第二口音類別標簽;

    12、所述根據所述融合后的樣本語音特征對所述待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型,包括:

    13、將所述融合后的樣本語音特征輸入至所述口音分類單元,得到樣本口音識別結果;

    14、將所述樣本語音識別結果和所述真實語音文本內容之間的差異,作為第一差異;

    15、將所述樣本口音識別結果和所述第二口音類別標簽之間的差異,作為第二差異;

    16、根據所述第一差異和所述第二差異,對所述待訓練的口音語音識別模型的模型參數進行調整,直至調整后的所述待訓練的口音語音識別模型滿足所述預設的訓練結束條件,得到所述預訓練的口音語音識別模型。

    17、在其中一個實施例中,所述遷移學習訓練方式包括多任務學習方式或域對抗訓練方式。

    18、在其中一個實施例中,在所述遷移學習訓練方式為所述域對抗訓練方式的情況下,所述根據所述第一差異和所述第二差異,對所述待訓練的口音語音識別模型的模型參數進行調整,直至調整后的所述待訓練的口音語音識別模型滿足所述預設的訓練結束條件,得到所述預訓練的口音語音識別模型,包括:

    19、根據所述第一差異和所述第二差異,通過反向傳播的方式對所述待訓練的口音語音識別模型的模型參數進行調整;其中,在反向傳播的過程中將所述模型參數的梯度與一個負的系數相乘;

    20、在調整后的所述待訓練的口音語音識別模型滿足所述預設的訓練結束條件,得到所述預訓練的口音語音識別模型。

    21、第二方面,本申請提供了一種語音識別方法,包括:

    22、獲取待識別的語音數據;

    23、將所述語音數據輸入至預訓練的口音語音識別模型,輸出語音識別結果;所述預訓練的口音語音識別模型為根據如上述所述的口音語音識別模型的訓練方法訓練得到的。

    24、第三方面,本申請還提供了一種口音語音識別模型的訓練裝置,包括:

    25、樣本獲取模塊,用于獲取樣本集;所述樣本集包括多種第一樣本口音語音數據和所述第一樣本口音語音數據對應的口語語音標簽;

    26、第一特征確定模塊,用于將所述第一樣本口音語音數據輸入至預訓練的微調語音模型的編碼單元,輸出攜帶有口音信息的第一樣本語音特征;所述預訓練的微調語音模型為采用攜帶有第一口音類別標簽的第二樣本口音語音數據,對預訓練的通用語音模型進行微調得到的;

    27、第二特征確定模塊,用于將所述第一樣本口音語音數據輸入至待訓練的口音語音識別模型的編碼單元,輸出第二樣本語音特征;

    28、融合模塊,用于將所述第一樣本語音特征和所述第二樣本語音特征融合,得到融合后的樣本語音特征;

    29、訓練模塊,用于根據所述融合后的樣本語音特征對所述待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型;所述預訓練的口音語音識別模型用于對輸入的語音數據進行語音識別。

    30、第四方面,本申請還提供了一種語音識別裝置,包括:

    31、數據獲取模塊,用于獲取待識別的語音數據;

    32、識別模塊,用于將所述語音數據輸入至預訓練的口音語音識別模型,輸出語音識別結果;所述預訓練的口音語音識別模型為根據如上述所述的口音語音識別模型的訓練方法訓練得到的。

    33、第五方面,本申請還提供了一種電子設備。所述電子設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述計算機程序被處理器執行時實現上述的方法的步驟。

    34、第六方面,本申請還提供了一種計算機可讀存儲介質。所述計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述的方法的步驟。

    35、第七方面,本申請還提供了一種計算機程序產品。所述計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現上述的方法的步驟。

    36、上述口音語音識別模型的訓練方法、語音識別方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品,通過獲取樣本集;樣本集包括多種第一樣本口音語音數據和第一樣本口音語本文檔來自技高網...

    【技術保護點】

    1.一種口音語音識別模型的訓練方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的方法,其特征在于,所述待訓練的口音語音識別模型還包括解碼單元,所述口語語音標簽包括真實語音文本內容;所述根據所述融合后的樣本語音特征對所述待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型,包括:

    3.根據權利要求2所述的方法,其特征在于,所述待訓練的口音語音識別模型的訓練方式采用遷移學習訓練方式,所述待訓練的口音語音識別模型還包括口音分類單元,所述口語語音標簽還包括第二口音類別標簽;

    4.根據權利要求3所述的方法,其特征在于,所述遷移學習訓練方式包括多任務學習方式或域對抗訓練方式。

    5.根據權利要求4所述的方法,其特征在于,在所述遷移學習訓練方式為所述域對抗訓練方式的情況下,所述根據所述第一差異和所述第二差異,對所述待訓練的口音語音識別模型的模型參數進行調整,直至調整后的所述待訓練的口音語音識別模型滿足所述預設的訓練結束條件,得到所述預訓練的口音語音識別模型,包括:

    6.一種語音識別方法,其特征在于,所述方法包括:>

    7.一種口音語音識別模型的訓練裝置,其特征在于,所述裝置包括:

    8.一種語音識別裝置,其特征在于,所述裝置包括:

    9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述的方法的步驟。

    10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。

    ...

    【技術特征摘要】

    1.一種口音語音識別模型的訓練方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的方法,其特征在于,所述待訓練的口音語音識別模型還包括解碼單元,所述口語語音標簽包括真實語音文本內容;所述根據所述融合后的樣本語音特征對所述待訓練的口音語音識別模型進行訓練,得到預訓練的口音語音識別模型,包括:

    3.根據權利要求2所述的方法,其特征在于,所述待訓練的口音語音識別模型的訓練方式采用遷移學習訓練方式,所述待訓練的口音語音識別模型還包括口音分類單元,所述口語語音標簽還包括第二口音類別標簽;

    4.根據權利要求3所述的方法,其特征在于,所述遷移學習訓練方式包括多任務學習方式或域對抗訓練方式。

    5.根據權利要求4所述的方法,其特征在于,在所述遷移學習訓練方式為所述域對抗訓練方式...

    【專利技術屬性】
    技術研發人員:戴子茜
    申請(專利權)人:天翼云科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 日韩人妻无码免费视频一区二区三区 | 亚洲精品无码成人AAA片| 曰韩无码AV片免费播放不卡| 伊人久久综合无码成人网| 无码中文字幕乱在线观看| 无码亚洲成a人在线观看| 无码人妻精品一区二区三18禁| (无码视频)在线观看| 人妻无码第一区二区三区| 内射无码专区久久亚洲| 中文午夜人妻无码看片| 成人无码网WWW在线观看| 男男AV纯肉无码免费播放无码| 亚洲国产精品无码一线岛国| 无码av专区丝袜专区| 精品无码人妻一区二区三区| 国产AV无码专区亚洲AWWW| mm1313亚洲国产精品无码试看| 精品无码av一区二区三区| 国产在线观看无码免费视频 | 内射人妻少妇无码一本一道 | 国产成人午夜无码电影在线观看| 久久中文字幕无码一区二区| 免费看又黄又无码的网站| 亚洲av无码乱码国产精品| 国产亚洲美日韩AV中文字幕无码成人| 无码日韩精品一区二区免费| 一区二区三区无码被窝影院 | 亚洲成av人片不卡无码久久| 色综合久久久无码网中文| 日韩精品无码一区二区三区免费| 中文字幕无码人妻AAA片| 国产啪亚洲国产精品无码| 亚洲色偷拍区另类无码专区| 国产aⅴ激情无码久久久无码| 韩国精品一区二区三区无码视频 | 亚洲av无码国产精品色在线看不卡 | 国产AV无码专区亚洲A∨毛片| 中文一国产一无码一日韩| 亚洲精品无码乱码成人| 潮喷大喷水系列无码久久精品|