System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,尤其涉及一種基于噪聲可控的歌聲合成方法、裝置、設備及介質。
技術介紹
1、在醫療領域,音樂療法是一種無創傷性的治療方法,對治療睡眠障礙、焦慮、注意力不集中由于沒有副作用,因此深受廣大患者歡迎。音樂療法中一般通過歌聲合成生成多樣化的音樂,現有技術中歌聲合成的方法大致分成兩種:第一種是給定歌曲的歌詞,以及旋律,音高等專業屬性,由參數化的生成器去擬合,生成這些屬性的歌聲。第二種通過大量的帶標注的訓練數據,在給定歌詞的情況下,由模型自己去學習旋律,音高等特征,根據學習后的模型合成對應歌聲。但這兩種方法或多或少均有著一些缺點,第一種方法中專業的音樂工作者非常稀少,很難做到滿足給定歌曲的歌詞,第二種方法中,由于依賴訓練數據使合成的歌聲的效果較差。因此,在醫療領域的音樂治療過程中,如何提高歌聲合成的效果成為亟需解決的問題。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種基于噪聲可控的歌聲合成方法、裝置、設備及存儲介質,以解決在醫療領域的音樂治療過程中,歌聲合成的效果較差的問題。
2、本申請實施例的第一方面提供了一種基于噪聲可控的歌聲合成方法?,所述的歌聲合成方法包括:
3、獲取預設情感信號,對所述預設情感信號進行情感特征編碼,得到所述預設情感信號對應的情感編碼特征,獲取預設節奏信號,對所述預設節奏信號進行節奏特征編碼,得到所述預設節奏信號對應的節奏編碼特征;
4、根據預設隨機函數,生成隨機噪聲值,將所述隨機噪聲值添加至預先定
5、將所述情感編碼特征與所述節奏編碼特征添加至所述隨機噪聲圖中,與所述隨機噪聲圖中對應像素中的隨機噪聲值進行融合,得到融合噪聲圖;
6、使用訓練好的神經網絡對所述融合噪聲圖進行噪聲預測,得到包含噪聲點與所述噪聲點對應的噪聲值的預測噪聲圖;
7、對所述預測噪聲圖進行去噪處理,得到去噪后的噪聲圖,將所述去噪后的噪聲圖確定為待合成梅爾頻譜,其中,所述去噪后的噪聲圖中的橫向坐標確定為所述待合成梅爾頻譜中的幀數,所述去噪后的噪聲圖中的縱向坐標確定為所述待合成梅爾頻譜中的頻度;
8、使用預設聲碼器將所述待合成梅爾頻譜合成對應歌聲。
9、本申請實施例的第二方面提供了一種基于噪聲可控的歌聲合成裝置,所述歌聲合成裝置包括:
10、獲取模塊,用于獲取預設情感信號,對所述預設情感信號進行情感特征編碼,得到所述預設情感信號對應的情感編碼特征,獲取預設節奏信號,對所述預設節奏信號進行節奏特征編碼,得到所述預設節奏信號對應的節奏編碼特征;
11、生成模塊,用于根據預設隨機函數,生成隨機噪聲值,將所述隨機噪聲值添加至預先定義的二維圖像的對應像素中,得到隨機噪聲圖;
12、添加模塊,用于將所述情感編碼特征與所述節奏編碼特征添加至所述隨機噪聲圖中,與所述隨機噪聲圖中對應像素中的隨機噪聲值進行融合,得到融合噪聲圖;
13、預測模塊,用于使用訓練好的神經網絡對所述融合噪聲圖進行噪聲預測,得到包含噪聲點與所述噪聲點對應的噪聲值的預測噪聲圖;
14、去噪模塊,用于對所述預測噪聲圖進行去噪處理,得到去噪后的噪聲圖,將所述去噪后的噪聲圖確定為待合成梅爾頻譜,其中,所述去噪后的噪聲圖中的橫向坐標確定為所述待合成梅爾頻譜中的幀數,所述去噪后的噪聲圖中的縱向坐標確定為所述待合成梅爾頻譜中的頻度;
15、合成模塊,用于使用預設聲碼器將所述待合成梅爾頻譜合成對應歌聲。
16、第三方面,本專利技術實施例提供一種計算機設備,所述計算機設備包括處理器、存儲器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如第一方面所述的基于噪聲可控的歌聲合成方法。
17、第四方面,本專利技術實施例提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現如第一方面所述的基于噪聲可控的歌聲合成方法。
18、本專利技術與現有技術相比存在的有益效果是:
19、根據預設隨機函數,生成隨機噪聲值,將隨機噪聲值添加至預先定義的二維圖像的對應像素中,得到隨機噪聲圖,將情感編碼特征與節奏編碼特征添加至隨機噪聲圖中,與隨機噪聲圖中對應像素中的隨機噪聲值進行融合,得到融合噪聲圖,使用訓練好的神經網絡對融合噪聲圖進行噪聲預測,得到包含噪聲點與噪聲點對應的噪聲值的預測噪聲圖,并對預測噪聲圖進行去噪處理,得到去噪后的噪聲圖,將去噪后的噪聲圖確定為待合成歌聲對應的待合成梅爾頻譜,使用預設聲碼器將待合成梅爾頻譜合成對應歌聲。本申請中,通過將預定義的情感編碼特征與預定義的節奏編碼特征融合至噪聲圖中,實現對歌聲合成中的情感與節奏的控制,實現可控的歌聲合成,從而提高歌聲合成的效果。在醫療領域的音樂治療過程中,可以合成可控的效果較好的多樣化音樂,有助于患者康復。
本文檔來自技高網...【技術保護點】
1.一種基于噪聲可控的歌聲合成方法,其特征在于,所述歌聲合成方法包括:
2.如權利要求1所述的歌聲合成方法,其特征在于,所述將所述情感編碼特征與所述節奏編碼特征添加至所述隨機噪聲圖中,與所述隨機噪聲圖中對應像素中的隨機噪聲值進行融合,得到融合噪聲圖,包括:
3.如權利要求1所述的歌聲合成方法,其特征在于,所述對所述預設情感信號進行情感特征編碼,得到所述預設情感信號對應的情感編碼特征,包括:
4.如權利要求1所述的歌聲合成方法,其特征在于,所述對所述預測噪聲圖進行去噪處理,得到去噪后的噪聲圖,包括:
5.如權利要求1所述的歌聲合成方法,其特征在于,所述使用訓練好的神經網絡對所述融合噪聲圖進行噪聲預測,得到包含噪聲點與所述噪聲點對應的噪聲值的預測噪聲圖之前,還包括:
6.如權利要求5所述的歌聲合成方法,其特征在于,所述計算所述第一梅爾頻譜與所述第三梅爾頻譜之間的損失值,包括:
7.一種基于噪聲可控的歌聲合成裝置,其特征在于,所述歌聲合成裝置包括:
8.如權利要求7所述的歌聲合成裝置,其特征在于,所述添
9.一種終端設備,其特征在于,所述終端設備包括處理器、存儲器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如權利要求1至6任一項所述的基于噪聲可控的歌聲合成方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至6任一項所述的基于噪聲可控的歌聲合成方法。
...【技術特征摘要】
1.一種基于噪聲可控的歌聲合成方法,其特征在于,所述歌聲合成方法包括:
2.如權利要求1所述的歌聲合成方法,其特征在于,所述將所述情感編碼特征與所述節奏編碼特征添加至所述隨機噪聲圖中,與所述隨機噪聲圖中對應像素中的隨機噪聲值進行融合,得到融合噪聲圖,包括:
3.如權利要求1所述的歌聲合成方法,其特征在于,所述對所述預設情感信號進行情感特征編碼,得到所述預設情感信號對應的情感編碼特征,包括:
4.如權利要求1所述的歌聲合成方法,其特征在于,所述對所述預測噪聲圖進行去噪處理,得到去噪后的噪聲圖,包括:
5.如權利要求1所述的歌聲合成方法,其特征在于,所述使用訓練好的神經網絡對所述融合噪聲圖進行噪聲預測,得到包含噪聲點與所述噪聲點對應的噪聲值的預測噪聲圖之...
【專利技術屬性】
技術研發人員:張旭龍,王健宗,程寧,趙金鳳,
申請(專利權)人:平安科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。