System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 无码中文字幕av免费放,成在人线av无码免费高潮水 ,无码人妻品一区二区三区精99
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    語(yǔ)音模型調(diào)整方法和裝置制造方法及圖紙

    技術(shù)編號(hào):44490638 閱讀:4 留言:0更新日期:2025-03-04 17:55
    本申請(qǐng)公開(kāi)了一種語(yǔ)音模型調(diào)整方法和裝置,該方法包括:獲得第一文本和用戶語(yǔ)音,所述用戶語(yǔ)音為用戶讀出所述第一文本的語(yǔ)音;確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段;從所述多個(gè)不匹配音頻片段中確定多個(gè)目標(biāo)音頻片段,所述多個(gè)目標(biāo)音頻片段之間具有對(duì)應(yīng)關(guān)系,所述目標(biāo)音頻片段的數(shù)量滿足數(shù)量要求;根據(jù)所述目標(biāo)音頻片段確定目標(biāo)音頻特征;基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本申請(qǐng)涉及計(jì)算機(jī),特別涉及一種語(yǔ)音模型調(diào)整方法和裝置


    技術(shù)介紹

    1、目前可以通過(guò)語(yǔ)音模型對(duì)用戶的語(yǔ)音進(jìn)行克隆,從而得到符合用戶音色的語(yǔ)音。由于用戶可能對(duì)一些文字發(fā)音不標(biāo)準(zhǔn),造成語(yǔ)音模型輸出的語(yǔ)音無(wú)法準(zhǔn)確匹配用戶的發(fā)音特征,輸出的語(yǔ)音準(zhǔn)確性低。


    技術(shù)實(shí)現(xiàn)思路

    1、本申請(qǐng)實(shí)施例提供了一種語(yǔ)音模型調(diào)整方法,包括:獲得第一文本和用戶語(yǔ)音,所述用戶語(yǔ)音為用戶讀出所述第一文本的語(yǔ)音;確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段;從所述多個(gè)不匹配音頻片段中確定多個(gè)目標(biāo)音頻片段,所述多個(gè)目標(biāo)音頻片段之間具有對(duì)應(yīng)關(guān)系,所述目標(biāo)音頻片段的數(shù)量滿足數(shù)量要求;根據(jù)所述目標(biāo)音頻片段確定目標(biāo)音頻特征;基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型。

    2、在一些實(shí)施例中,所述確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段,包括:對(duì)所述用戶語(yǔ)音進(jìn)行語(yǔ)音識(shí)別,得到第二文本;將所述第二文本與所述第一文本進(jìn)行比對(duì),確定所述第二文本中與所述第一文本不匹配的文本信息;根據(jù)所述文本信息從所述用戶語(yǔ)音中確定所述不匹配音頻片段。

    3、在一些實(shí)施例中,所述確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段,包括:對(duì)所述第一文本進(jìn)行語(yǔ)音合成,得到第一音頻;將所述第一音頻與所述用戶語(yǔ)音進(jìn)行比對(duì),得到所述不匹配音頻片段。

    4、在一些實(shí)施例中,對(duì)所述第一文本進(jìn)行語(yǔ)音合成,得到第一音頻,包括:確定所述用戶語(yǔ)音的發(fā)音風(fēng)格參數(shù);利用符合所述發(fā)音風(fēng)格參數(shù)的語(yǔ)音合成模型對(duì)所述第一文本進(jìn)行語(yǔ)音合成,得到所述第一音頻。

    5、在一些實(shí)施例中,所述從所述多個(gè)不匹配音頻片段中確定多個(gè)目標(biāo)音頻片段,包括:對(duì)所述不匹配音頻片段進(jìn)行聚類處理,得到多個(gè)聚類集合;從所述多個(gè)聚類集合中確定目標(biāo)聚類集合,所述目標(biāo)聚類集合中所述不匹配音頻片段的數(shù)量滿足所述數(shù)量要求,所述目標(biāo)聚類集合中的所述不匹配音頻片段為所述目標(biāo)音頻片段。

    6、在一些實(shí)施例中,對(duì)所述不匹配音頻片段進(jìn)行聚類處理,包括以下至少之一:根據(jù)與所述不匹配音頻片段對(duì)應(yīng)的文字對(duì)所述不匹配音頻片段進(jìn)行聚類處理;根據(jù)與所述不匹配音頻片段對(duì)應(yīng)的音素對(duì)所述不匹配音頻片段進(jìn)行聚類處理。

    7、在一些實(shí)施例中,所述目標(biāo)聚類集合所對(duì)應(yīng)的文字與預(yù)設(shè)文字庫(kù)中的任意文字都不同。

    8、在一些實(shí)施例中,所述基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型,包括:根據(jù)所述目標(biāo)音頻特征和與所述目標(biāo)音頻特征對(duì)應(yīng)的音素,生成音素音頻特征對(duì);基于所述音素音頻特征對(duì),對(duì)所述第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到所述第二語(yǔ)音模型。

    9、在一些實(shí)施例中,所述第一語(yǔ)音模型包括第一語(yǔ)音克隆子模型和第一語(yǔ)音調(diào)整子模型,基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型,包括:根據(jù)所述目標(biāo)音頻特征和與所述目標(biāo)音頻特征對(duì)應(yīng)的音素,生成音素音頻特征對(duì);基于所述音素音頻特征對(duì),對(duì)所述第一語(yǔ)音調(diào)整子模型進(jìn)行參數(shù)調(diào)整,得到所述第二語(yǔ)音模型,所述第一語(yǔ)音克隆子模型能夠在輸入第三文本后生成第一語(yǔ)音,所述調(diào)整后的第一語(yǔ)音調(diào)整子模型能夠在輸入所述第一語(yǔ)音后生成目標(biāo)語(yǔ)音。

    10、本申請(qǐng)實(shí)施例還提出了一種語(yǔ)音模型調(diào)整裝置,包括:獲得模塊,用于獲得第一文本和用戶語(yǔ)音,所述用戶語(yǔ)音為用戶讀出所述第一文本的語(yǔ)音;第一確定模塊,用于確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段;第二確定模塊,用于從所述多個(gè)不匹配音頻片段中確定多個(gè)目標(biāo)音頻片段,所述多個(gè)目標(biāo)音頻片段之間具有對(duì)應(yīng)關(guān)系,所述目標(biāo)音頻片段的數(shù)量滿足數(shù)量要求;第三確定模塊,用于根據(jù)所述目標(biāo)音頻片段確定目標(biāo)音頻特征;調(diào)整模塊,用于基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型。

    本文檔來(lái)自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種語(yǔ)音模型調(diào)整方法,包括:

    2.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段,包括:

    3.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段,包括:

    4.如權(quán)利要求3所述的語(yǔ)音模型調(diào)整方法,對(duì)所述第一文本進(jìn)行語(yǔ)音合成,得到第一音頻,包括:

    5.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述從所述多個(gè)不匹配音頻片段中確定多個(gè)目標(biāo)音頻片段,包括:

    6.如權(quán)利要求5所述的語(yǔ)音模型調(diào)整方法,對(duì)所述不匹配音頻片段進(jìn)行聚類處理,包括以下至少之一:

    7.如權(quán)利要求6所述的語(yǔ)音模型調(diào)整方法,所述目標(biāo)聚類集合所對(duì)應(yīng)的文字與預(yù)設(shè)文字庫(kù)中的任意文字都不同。

    8.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型,包括:

    9.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述第一語(yǔ)音模型包括第一語(yǔ)音克隆子模型和第一語(yǔ)音調(diào)整子模型,基于所述目標(biāo)音頻特征對(duì)第一語(yǔ)音模型進(jìn)行參數(shù)調(diào)整,得到第二語(yǔ)音模型,包括:

    10.一種語(yǔ)音模型調(diào)整裝置,包括:

    ...

    【技術(shù)特征摘要】

    1.一種語(yǔ)音模型調(diào)整方法,包括:

    2.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段,包括:

    3.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述確定所述用戶語(yǔ)音中與所述第一文本不匹配的多個(gè)不匹配音頻片段,包括:

    4.如權(quán)利要求3所述的語(yǔ)音模型調(diào)整方法,對(duì)所述第一文本進(jìn)行語(yǔ)音合成,得到第一音頻,包括:

    5.如權(quán)利要求1所述的語(yǔ)音模型調(diào)整方法,所述從所述多個(gè)不匹配音頻片段中確定多個(gè)目標(biāo)音頻片段,包括:

    6.如權(quán)利要求5所述的語(yǔ)音模型調(diào)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:李曉梅張曉平
    申請(qǐng)(專利權(quán))人:聯(lián)想北京有限公司
    類型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产V片在线播放免费无码| 亚洲人成人无码.www石榴| 精品人妻无码专区在中文字幕| 亚洲人成人伊人成综合网无码| 亚洲av中文无码乱人伦在线观看| 国产精品毛片无码| 无码一区二区三区免费| 国产精品一区二区久久精品无码 | 无码137片内射在线影院| 一级片无码中文字幕乱伦| 国产AV无码专区亚洲AV麻豆丫| 毛片免费全部播放无码| 日韩精品人妻系列无码专区免费 | 亚洲av成人中文无码专区| 免费无码作爱视频| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻系列av无码一区二区 | 国产精品无码a∨精品| 国产无遮挡无码视频免费软件| 亚洲中文无码mv| 无码午夜人妻一区二区三区不卡视频 | 无码精品人妻一区二区三区免费 | 国产精品无码AV一区二区三区| 日韩专区无码人妻| 精品无码国产一区二区三区麻豆| 无码中文字幕乱码一区| 久久亚洲精品无码VA大香大香| 精品人妻无码专区中文字幕| 国产精品无码AV不卡| 久久人妻无码一区二区| 西西4444www大胆无码| 国产午夜无码福利在线看网站| 中文字幕精品三区无码亚洲| 日韩aⅴ人妻无码一区二区| 亚洲国产成人精品无码区二本| 精品人无码一区二区三区| 久久久久亚洲AV无码观看| 亚洲成无码人在线观看| 中文字幕无码乱码人妻系列蜜桃| 69天堂人成无码麻豆免费视频| 久久av无码专区亚洲av桃花岛| 精品人无码一区二区三区|