System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及語音合成,尤其涉及一種身份加密的情感語音合成方法及系統。
技術介紹
1、在信息技術快速發展的今天,語音識別與合成技術已廣泛應用于智能設備、虛擬助手、遠程通信等多個領域,成為現代通信不可或缺的一部分。現有的技術通過高度復雜的算法,能夠準確識別和模擬人類的語音,實現人機交互的自然流暢。在語音合成領域,文本到語音(tts)技術的發展已從最初的拼接合成發展到基于深度學習的端到端生成模型,能夠生成極為自然的語音,幾乎無法與真人語音區分。
2、雖然現有的語音識別與合成技術已經取得了顯著進展,但在個人隱私保護方面仍存在不少挑戰。當前技術主要關注于提高識別準確度和合成自然度,較少考慮語音數據本身可能攜帶的敏感信息。現有的語音加密技術多數聚焦于信號級別的加密,雖然在一定程度上可以保護語音內容不被輕易理解,但往往會導致語音品質下降,甚至在一些情況下,經過專業分析仍然可能恢復出原始語音內容,導致隱私泄露。
3、因此,提出一種在保留語音自然度和表達豐富性的同時,保證語音消息隱私安全的情感語音合成方法及系統是十分有必要的。
技術實現思路
1、本專利技術的目的在于提供一種身份加密的情感語音合成方法及系統,實現在保留語音自然度和表達豐富性的同時,保證語音消息隱私安全。
2、為實現上述目的,本專利技術采用的一種身份加密的情感語音合成系統,包括輸入模塊、語音特征提取模塊、情感分析模塊、文本轉換模塊、語音合成模塊、加密處理模塊和輸出模塊,所述輸入模塊分別與所述語音特征
3、所述輸入模塊用于用戶輸入原始語音數據;
4、所述語音特征提取模塊用于從原始語音數據中提取出聲學特征;
5、所述情感分析模塊用于根據聲學特征識別出用戶的情感傾向,得到情感分析結果;
6、所述文本轉換模塊用于分別將情感分析結果、原始語音數據進行文本轉換,分別得到情感分析文本數據、原始語音文本數據;
7、所述語音合成模塊用于將情感分析文本數據、原始語音文本數據轉換為合成語音;
8、所述加密處理模塊用于對合成語音進行加密;
9、所述輸出模塊用于對用戶輸出合成語音。
10、其中,所述語音特征提取模塊包括語音預處理單元、語音特征提取單元、語音特征融合單元和綜合聲學特征輸出單元,所述語音預處理單元與所述輸入模塊連接,所述語音特征提取單元與所述語音預處理單元連接,所述語音特征融合單元分別與所述語音特征提取單元和所述綜合聲學特征輸出單元連接。
11、其中,所述語音預處理單元用于對原始語音數據進行去噪和增強處理;
12、所述語音特征提取單元用于提取原始語音數據中的聲學特征,包括音高、音色、語速、節奏、強度;
13、所述語音特征融合單元用于將提取到的聲學特征進行融合,得到綜合聲學特征;
14、所述綜合聲學特征輸出單元用于輸出綜合聲學特征。
15、其中,所述情感分析模塊包括情感特征提取單元、情感特征融合單元、對抗性訓練單元、元學習策略單元和情感狀態輸出單元,所述情感特征提取單元與所述語音特征提取模塊連接,所述情感特征融合單元分別與所述情感特征提取單元和所述對抗性訓練單元連接,所述元學習策略單元與所述對抗性訓練單元連接,所述情感狀態輸出單元與所述元學習策略單元連接。
16、其中,所述情感特征提取單元用于從聲學特征中提取情感特征;
17、所述情感特征融合單元用于融合情感特征;
18、所述對抗性訓練單元用于引入擾動,對識別融合情感特征進行訓練;
19、所述元學習策略單元用于在多種識別任務進行訓練,并得到情感分析結果;
20、所述情感狀態輸出單元用于輸出情感分析結果。
21、其中,所述語音合成模塊包括文本預處理單元、情感編碼單元、數據處理單元、語音生成單元、優化單元、評估單元和合成語音輸出單元,所述文本預處理單元與所述輸入模塊連接,所述情感編碼單元與所述情感分析模塊連接,所述數據處理單元分別與所述文本預處理單元和所述情感編碼單元連接,所述語音生成單元與所述數據處理單元連接,所述優化單元分別與所述語音生成單元和所述評估單元連接,所述合成語音輸出單元與所述評估單元連接。
22、其中,所述文本預處理單元用于將原始語音數據進行文本轉換,得到原始語音文本數據;
23、所述情感編碼單元用于將情感分析結果進行文本轉換,得到情感分析文本數據;
24、所述數據處理單元用于分別對原始語音文本數據和情感分析文本數據進行處理;
25、所述語音生成單元用于分別根據處理后的原始語音文本數據和情感分析文本數據生成語音數據;
26、所述優化單元用于對生成的語音數據進行優化處理;
27、所述評估單元用于對生成的語音數據進行語音質量評估;
28、所述合成語音輸出單元用于將生成的語音數據進行合成。
29、其中,所述加密處理模塊包括格式轉換單元、同態加密處理單元、量子密鑰單元、屬性加密單元、輕量加密單元和加密數據存儲單元,所述格式轉換單元分別與所述語音合成模塊、所述同態加密處理單元、所述量子密鑰單元、所述屬性加密單元和所述輕量加密單元連接,所述加密數據存儲單元分別與所述語音合成模塊、所述同態加密處理單元、所述量子密鑰單元、所述屬性加密單元、所述輕量加密單元連接和所述輸出模塊連接。
30、其中,所述格式轉換單元用于對合成語音進行格式的轉換;
31、所述同態加密處理單元用于提供第一種加密方式,對合成語音進行加密,得到加密數據;
32、所述量子密鑰單元用于提供第二種加密方式,對合成語音進行加密,得到加密數據;
33、所述屬性加密單元用于提供第三種加密方式,對合成語音進行加密,得到加密數據;
34、所述輕量加密單元用于提供第四種加密方式,對合成語音進行加密,得到加密數據;
35、所述加密數據存儲單元用于存儲,得到加密數據。
36、本專利技術還提供一種身份加密的情感語音合成方法,包括如下步驟:
37、輸入原始語音數據;
38、提取聲學特征,并根據聲學特征識別出用戶的情感傾向,得到情感分析結果;
39、分別將情感分析結果、原始語音數據進行文本轉換,分別得到情感分析文本數據、原始語音文本數據;
40、將情感分析文本數據、原始語音文本數據轉換為合成語音;
41、對合成語音進行加密,并對用戶輸出合成語音。
42、本專利技術的一種身份加密的情感語音合成方法及系統,通過所述輸入模塊用于用戶輸入原始語音數據;所述語音特征提取模塊用于從原始語音數據中提取出聲學特本文檔來自技高網...
【技術保護點】
1.一種身份加密的情感語音合成系統,其特征在于,
2.如權利要求1所述的身份加密的情感語音合成系統,其特征在于,
3.如權利要求2所述的身份加密的情感語音合成系統,其特征在于,
4.如權利要求1所述的身份加密的情感語音合成系統,其特征在于,
5.如權利要求4所述的身份加密的情感語音合成系統,其特征在于,
6.如權利要求1所述的身份加密的情感語音合成系統,其特征在于,
7.如權利要求6所述的身份加密的情感語音合成系統,其特征在于,
8.一種身份加密的情感語音合成方法,應用于如權利要求1所述的身份加密的情感語音合成系統,其特征在于,包括如下步驟:
【技術特征摘要】
1.一種身份加密的情感語音合成系統,其特征在于,
2.如權利要求1所述的身份加密的情感語音合成系統,其特征在于,
3.如權利要求2所述的身份加密的情感語音合成系統,其特征在于,
4.如權利要求1所述的身份加密的情感語音合成系統,其特征在于,
5.如權利要求4所述的身份...
【專利技術屬性】
技術研發人員:趙勝,丁卓,潘友健,
申請(專利權)人:南京龍垣信息科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。