System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国产精品无码一区二区三区毛片,无码人妻久久一区二区三区免费丨,免费无码又爽又刺激毛片
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    音頻生成方法、裝置、電子設備和計算機程序產(chǎn)品制造方法及圖紙

    技術編號:44268440 閱讀:6 留言:0更新日期:2025-02-14 22:10
    本申請?zhí)岢鲆环N音頻生成方法、裝置、電子設備和計算機程序產(chǎn)品,能夠獲取待處理文本和音頻風格信息,其中,音頻風格信息用于指示待生成的目標音頻對應的音頻風格,然后將待處理文本和音頻風格信息均輸入到預先訓練的音頻編輯模型中,得到音頻編輯模型輸出的、與待處理文本和音頻風格信息對應的離散編碼,通過對離散編碼進行解碼處理,得到目標音頻。如此設置,利用音頻編輯模型輸出與待處理文本和音頻風格信息對應的離散編碼,通過對離散編碼解碼生成內容風格均符合要求的音頻,大大降低了音視頻編輯難度,提高了用戶的創(chuàng)作效率。

    【技術實現(xiàn)步驟摘要】

    本申請涉及音頻生成,尤其涉及一種音頻生成方法、裝置、電子設備和計算機程序產(chǎn)品


    技術介紹

    1、發(fā)布視頻成為人們記錄生活、分享觀點以及表達情感的重要方式。然而拍攝時往往存在大量的停頓、脫口而出、詞不達意或冗余內容,人們需要在多次的錄制或繁瑣的剪輯工作后才能得到令人滿意的視頻。若能夠通過編輯文本的形式直接生成視頻中的語音內容,將大大降低音視頻編輯難度,提高用戶的創(chuàng)作效率。

    2、因此,如何通過編輯文本的形式直接生成視頻中的語音內容,成為本領域技術人員亟待解決的技術問題。


    技術實現(xiàn)思路

    1、有鑒于此,本申請?zhí)岢鲆环N音頻的生成方法、裝置、電子設備和計算機程序產(chǎn)品,該方法能夠通過編輯文本的形式直接生成視頻中的語音內容。

    2、本申請?zhí)岢龅募夹g方案具體如下:

    3、第一方面,本申請的實施例提供一種音頻生成方法,包括:

    4、獲取待處理文本和音頻風格信息;其中,所述音頻風格信息用于指示待生成的目標音頻對應的音頻風格;

    5、將所述待處理文本和所述音頻風格信息均輸入到預先訓練的音頻編輯模型中,得到所述音頻編輯模型輸出的、與所述待處理文本和所述音頻風格信息對應的離散編碼;

    6、對所述離散編碼進行解碼處理,得到所述目標音頻。

    7、第二方面,本申請的實施例提供一種音頻生成裝置,包括:

    8、獲取模塊,用于獲取待處理文本和音頻風格信息;其中,所述音頻風格信息用于指示待生成的目標音頻對應的音頻風格;

    9、輸入模塊,用于將所述待處理文本和所述音頻風格信息均輸入到預先訓練的音頻編輯模型中,得到所述音頻編輯模型輸出的、與所述待處理文本和所述音頻風格信息對應的離散編碼;

    10、解碼模塊,用于對所述離散編碼進行解碼處理,得到所述目標音頻。

    11、第三方面,本申請的實施例提供一種電子設備,包括:

    12、存儲器和處理器;其中,所述存儲器用于存儲程序;所述處理器,用于通過運行所述存儲器中的程序,實現(xiàn)以上任意一項所述的方法。

    13、第四方面,本申請的實施例提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括計算機程序或計算機指令,所述計算機程序或計算機指令被處理器執(zhí)行時,實現(xiàn)以上任意一項所述的方法。

    14、本申請?zhí)岢龅囊纛l生成方法,能夠獲取待處理文本和音頻風格信息,其中,音頻風格信息用于指示待生成的目標音頻對應的音頻風格,然后將待處理文本和音頻風格信息均輸入到預先訓練的音頻編輯模型中,得到音頻編輯模型輸出的、與待處理文本和音頻風格信息對應的離散編碼,通過對離散編碼進行解碼處理,得到目標音頻。如此設置,利用音頻編輯模型輸出與待處理文本和音頻風格信息對應的離散編碼,通過對離散編碼解碼生成內容風格均符合要求的音頻,大大降低了音視頻編輯難度,提高了用戶的創(chuàng)作效率。

    本文檔來自技高網(wǎng)...

    【技術保護點】

    1.一種音頻生成方法,其特征在于,包括:

    2.根據(jù)權利要求1所述的方法,其特征在于,所述音頻編輯模型的訓練過程包括:

    3.根據(jù)權利要求2所述的方法,其特征在于,所述獲取所述音頻編輯模型的訓練樣本,包括:

    4.根據(jù)權利要求2所述的方法,其特征在于,所述獲取音頻編輯模型的訓練樣本,包括:

    5.根據(jù)權利要求4所述的方法,其特征在于,所述殘差矢量量化器包括多層并行的子殘差矢量量化器;所述樣本離散編碼包括各層子殘差矢量量化器輸出的子樣本離散編碼;

    6.根據(jù)權利要求2所述的方法,其特征在于,所述訓練樣本還包括所述樣本音頻中每個音素對應的時長;所述獲取音頻編輯模型的訓練樣本,包括:

    7.根據(jù)權利要求2所述的方法,其特征在于,所述訓練樣本還包括所述樣本音頻中的各音素。

    8.一種音頻生成裝置,其特征在于,包括:

    9.一種電子設備,其特征在于,包括:

    10.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機程序或計算機指令,所述計算機程序或計算機指令被處理器執(zhí)行時,實現(xiàn)如權利要求1至7中任意一項所述的方法。

    ...

    【技術特征摘要】

    1.一種音頻生成方法,其特征在于,包括:

    2.根據(jù)權利要求1所述的方法,其特征在于,所述音頻編輯模型的訓練過程包括:

    3.根據(jù)權利要求2所述的方法,其特征在于,所述獲取所述音頻編輯模型的訓練樣本,包括:

    4.根據(jù)權利要求2所述的方法,其特征在于,所述獲取音頻編輯模型的訓練樣本,包括:

    5.根據(jù)權利要求4所述的方法,其特征在于,所述殘差矢量量化器包括多層并行的子殘差矢量量化器;所述樣本離散編碼包括各層子殘差矢量量化器輸出的子樣本離散編碼;

    6.根據(jù)...

    【專利技術屬性】
    技術研發(fā)人員:岳顏顏唐海桃吳明輝
    申請(專利權)人:科大訊飛股份有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 成人无码AV一区二区| 国产自无码视频在线观看| 无码人妻精品一区二区三区夜夜嗨 | 乱人伦人妻中文字幕无码| 国产AV天堂无码一区二区三区| 中文字幕精品无码一区二区 | 99久久国产热无码精品免费| 亚洲免费日韩无码系列| 无码H肉动漫在线观看| 国产成人亚洲精品无码AV大片| 日韩一区二区三区无码影院| 久久午夜无码鲁丝片午夜精品 | 无码精品国产一区二区三区免费| 无码人妻一区二区三区免费 | 久久精品中文无码资源站| 五月婷婷无码观看| 亚洲中文字幕无码中文| 无码人妻一区二区三区在线| JLZZJLZZ亚洲乱熟无码| 无码AV动漫精品一区二区免费| 中文AV人妻AV无码中文视频| 人妻丰满熟妞av无码区 | 人禽无码视频在线观看| 亚洲国产精品无码专区在线观看 | 国产成人无码网站| 中文字幕韩国三级理论无码| 久久亚洲AV成人出白浆无码国产| 亚洲av无码一区二区三区不卡| 国产成人麻豆亚洲综合无码精品 | 伊人无码精品久久一区二区 | 亚洲无码精品浪潮| 成人无码精品一区二区三区| 国产精品爽爽V在线观看无码| 无码午夜人妻一区二区不卡视频| 少妇人妻偷人精品无码AV | 色综合热无码热国产| 无码人妻aⅴ一区二区三区有奶水| 久久亚洲中文无码咪咪爱| 无码av专区丝袜专区| 亚洲午夜无码片在线观看影院猛| 五月丁香六月综合缴清无码|