System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 无码中文av有码中文av,国产在线无码精品无码,国产精品无码一区二区三区毛片
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種音頻節(jié)拍解析方法、車輛、計(jì)算機(jī)設(shè)備和程序產(chǎn)品技術(shù)

    技術(shù)編號:44408631 閱讀:3 留言:0更新日期:2025-02-25 10:21
    本公開提供了一種音頻節(jié)拍解析方法、車輛、計(jì)算機(jī)設(shè)備和程序產(chǎn)品,其中,該方法包括:對音頻數(shù)據(jù)進(jìn)行音頻信號解析處理,得到所述音頻數(shù)據(jù)的幅度譜特征數(shù)據(jù)、音高特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù);對所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)進(jìn)行拼接,得到拼接特征數(shù)據(jù);將所述拼接特征數(shù)據(jù)輸入深度學(xué)習(xí)模型,依次經(jīng)過與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器進(jìn)行特征提取后,得到所述音頻數(shù)據(jù)對應(yīng)的節(jié)拍特征;其中,不同特征提取器對應(yīng)的特征提取尺度不同;根據(jù)所述節(jié)拍特征,生成所述音頻數(shù)據(jù)的節(jié)拍信息。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本公開涉及計(jì)算機(jī),具體而言,涉及一種音頻節(jié)拍解析方法、車輛、計(jì)算機(jī)設(shè)備和程序產(chǎn)品


    技術(shù)介紹

    1、對音頻數(shù)據(jù)中的節(jié)拍進(jìn)行解析,可以更好地幫助用戶理解和學(xué)習(xí)音樂。但是傳統(tǒng)的音頻節(jié)拍解析方式,不僅會(huì)出現(xiàn)節(jié)拍解析錯(cuò)位的問題,而且由于在對不同風(fēng)格或節(jié)奏的音頻數(shù)據(jù)進(jìn)行解析時(shí),采用同樣的解析參數(shù),導(dǎo)致無法捕捉到音樂風(fēng)格的節(jié)奏變化和個(gè)性化表現(xiàn),造成了解析出的節(jié)拍與音頻數(shù)據(jù)的實(shí)際節(jié)拍嚴(yán)重不符的問題,影響了節(jié)拍解析的準(zhǔn)確性。


    技術(shù)實(shí)現(xiàn)思路

    1、本公開實(shí)施例至少提供一種音頻節(jié)拍解析方法、車輛、計(jì)算機(jī)設(shè)備和程序產(chǎn)品。

    2、第一方面,本公開實(shí)施例提供了一種音頻節(jié)拍解析方法,包括:

    3、對音頻數(shù)據(jù)進(jìn)行音頻信號解析處理,得到所述音頻數(shù)據(jù)的幅度譜特征數(shù)據(jù)、音高特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù);

    4、對所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)進(jìn)行拼接,得到拼接特征數(shù)據(jù);

    5、將所述拼接特征數(shù)據(jù)輸入深度學(xué)習(xí)模型,依次經(jīng)過與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器進(jìn)行特征提取后,得到所述音頻數(shù)據(jù)對應(yīng)的節(jié)拍特征;其中,不同特征提取器對應(yīng)的特征提取尺度不同;

    6、根據(jù)所述節(jié)拍特征,生成所述音頻數(shù)據(jù)的節(jié)拍信息。

    7、該實(shí)施方式,通過提取音頻幅度維度上的幅度譜特征數(shù)據(jù)、音樂風(fēng)格維度上的音高特征數(shù)據(jù)和節(jié)奏變化特征維度上的節(jié)奏特征數(shù)據(jù),可以實(shí)現(xiàn)充分挖掘音頻數(shù)據(jù)在各方面的特征數(shù)據(jù),再通過將三個(gè)維度上的特征數(shù)據(jù)進(jìn)行拼接,可以使得拼接特征能夠充分表征音頻數(shù)據(jù)的音樂特征。由于不同的特征提取器對應(yīng)于不同的特征提取尺度,所以利用與各種維度分別對應(yīng)的特征提取器對拼接特征進(jìn)行特征提取,可以實(shí)現(xiàn)對各維度上的特征數(shù)據(jù)進(jìn)行對應(yīng)尺度的充分挖掘和識別,確保對音頻數(shù)據(jù)的前奏和節(jié)奏變化進(jìn)行全面理解,避免空白前奏、音樂風(fēng)格和節(jié)奏變化對節(jié)拍識別的影響,適應(yīng)多種音樂風(fēng)格和節(jié)奏變化,從而得到準(zhǔn)確的節(jié)拍特征。最后,利用節(jié)拍特征,可以生成準(zhǔn)確且符合音頻數(shù)據(jù)的風(fēng)格的節(jié)拍信息。

    8、在一種可能的實(shí)施方式中,每個(gè)所述特征提取器包括卷積層和注意力提取層;與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器中的卷積層的卷積尺度不同。

    9、該實(shí)施方式,利用特征提取器中的卷積層對輸入特征進(jìn)行卷積處理,可以實(shí)現(xiàn)對輸入特征中的細(xì)粒度特征的充分挖掘,再利用注意力提取層進(jìn)行特征提取,可以提取出能夠更加準(zhǔn)確反映節(jié)拍特征的特征數(shù)據(jù)。且利用不同卷積尺度的卷積層對特征進(jìn)行提取,可以實(shí)現(xiàn)對各個(gè)維度上的特征進(jìn)行針對性的卷積處理,從而得到更準(zhǔn)確的卷積特征。

    10、在一種可能的實(shí)施方式中,將所述拼接特征數(shù)據(jù)輸入深度學(xué)習(xí)模型,依次經(jīng)過與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器進(jìn)行特征提取后,得到所述音頻數(shù)據(jù)對應(yīng)的節(jié)拍特征,包括:

    11、利用與所述幅度譜特征數(shù)據(jù)對應(yīng)的第一特征提取器,對所述拼接特征數(shù)據(jù)進(jìn)行特征提取,得到第一中間特征數(shù)據(jù);

    12、將所述第一中間特征和所述節(jié)奏特征數(shù)據(jù)拼接后輸入與節(jié)奏特征數(shù)據(jù)對應(yīng)的第二特征提取器,得到第二中間特征數(shù)據(jù);

    13、將所述第二中間特征和所述音高特征數(shù)據(jù)拼接后輸入與所述音高特征數(shù)據(jù)對應(yīng)的第三特征提取器,得到第三中間特征數(shù)據(jù);

    14、利用所述深度學(xué)習(xí)模型中的解碼器,對所述第三中間特征數(shù)據(jù)進(jìn)行特征解碼處理,得到所述節(jié)拍特征。

    15、該實(shí)施方式,利用第一特征提取器,可以建模出能夠宏觀上反映音頻數(shù)據(jù)的音樂特征的第一中間特征數(shù)據(jù),利用第二特征提取器對第一中間特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù)的拼接數(shù)據(jù)進(jìn)行特征提取,可以建模出更微觀的節(jié)奏變化特征(即第二中間特征數(shù)據(jù)),最后再利用第三特征提取器對第二中間特征數(shù)據(jù)和音高特征數(shù)據(jù)的拼接數(shù)據(jù)進(jìn)行特征提取,可以利用更高維度的特征表示整條音頻數(shù)據(jù),實(shí)現(xiàn)對音頻數(shù)據(jù)的準(zhǔn)確表征。最后利用解碼器進(jìn)行解碼處理,可以得到準(zhǔn)確的節(jié)拍特征。

    16、在一種可能的實(shí)施方式中,所述對音頻數(shù)據(jù)進(jìn)行音頻信號解析處理,得到所述音頻數(shù)據(jù)的幅度譜特征數(shù)據(jù)、音高特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù),包括:

    17、對所述音頻數(shù)據(jù)進(jìn)行預(yù)處理,得到所述音頻數(shù)據(jù)對應(yīng)的每幀音頻信號;所述預(yù)處理包括采樣率標(biāo)準(zhǔn)化、音頻數(shù)據(jù)分幀、音頻信號歸一化和音頻信號去噪;

    18、對每幀所述音頻信號進(jìn)行短時(shí)傅里葉變換,得到每幀所述音頻信號的幅度譜特征、頻率信息、以及每幀音頻信號對應(yīng)的頻率特征點(diǎn)的能量;

    19、根據(jù)每幀所述音頻信號的頻率信息,確定所述音頻數(shù)據(jù)的音高特征數(shù)據(jù);

    20、根據(jù)每幀所述音頻信號對應(yīng)的頻率特征點(diǎn)的能量,確定所述音頻數(shù)據(jù)的節(jié)奏特征數(shù)據(jù)。

    21、該實(shí)施方式,通過對音頻數(shù)據(jù)進(jìn)行預(yù)處理,可以提高模型的輸入質(zhì)量。通過對每幀音頻信號進(jìn)行短時(shí)傅里葉變化,可以實(shí)現(xiàn)對音頻數(shù)據(jù)在時(shí)域和頻域上的轉(zhuǎn)換,得到準(zhǔn)確地幅度譜特征、頻率信息和頻率特征點(diǎn)的能量。再利用頻率信息和能量信息,可以解析出音頻數(shù)據(jù)對應(yīng)的準(zhǔn)確的音高特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù)。

    22、在一種可能的實(shí)施方式中,所述根據(jù)每幀所述音頻信號對應(yīng)的頻率特征點(diǎn)的能量,確定所述音頻數(shù)據(jù)的節(jié)奏特征數(shù)據(jù),包括:

    23、根據(jù)每個(gè)所述頻率特征點(diǎn)的能量和位于所述頻率特征點(diǎn)的預(yù)設(shè)時(shí)間間隔內(nèi)的各個(gè)目標(biāo)特征點(diǎn)的能量,從各個(gè)所述頻率特征點(diǎn)中確定所述音頻數(shù)據(jù)對應(yīng)的各個(gè)節(jié)拍點(diǎn);

    24、根據(jù)各個(gè)節(jié)拍點(diǎn)的節(jié)拍時(shí)間和相鄰節(jié)拍點(diǎn)之間的時(shí)間間隔,確定所述音頻數(shù)據(jù)的每分鐘節(jié)拍數(shù);

    25、根據(jù)所述相鄰節(jié)拍點(diǎn)之間的時(shí)間間隔和所述每分鐘節(jié)拍數(shù),確定所述節(jié)奏特征數(shù)據(jù)。

    26、該實(shí)施方式,利用頻率特征點(diǎn)的能量以及附近時(shí)間的目標(biāo)特征點(diǎn)的能量,可以準(zhǔn)確確定出頻率特征點(diǎn)是否為明顯的節(jié)拍點(diǎn)。利用確定出的節(jié)拍點(diǎn)和節(jié)拍間隔,可以確定出能夠表征節(jié)奏緩急的每分鐘節(jié)拍數(shù),再利用時(shí)間間隔和每分鐘節(jié)拍數(shù),可以得到能夠準(zhǔn)確反映節(jié)奏變化的節(jié)奏特征數(shù)據(jù)。

    27、在一種可能的實(shí)施方式中,所述根據(jù)每個(gè)所述頻率特征點(diǎn)的能量和位于所述頻率特征點(diǎn)的預(yù)設(shè)時(shí)間間隔內(nèi)的各個(gè)目標(biāo)特征點(diǎn)的能量,從各個(gè)所述頻率特征點(diǎn)中確定所述音頻數(shù)據(jù)對應(yīng)的各個(gè)節(jié)拍點(diǎn),包括:

    28、針對任一所述頻率特征點(diǎn),若所述頻率特征點(diǎn)的能量超過預(yù)設(shè)閾值、且超過位于所述頻率特征點(diǎn)的預(yù)設(shè)時(shí)間間隔內(nèi)的各個(gè)目標(biāo)特征點(diǎn)的能量,確定所述頻率特征點(diǎn)為所述音頻數(shù)據(jù)對應(yīng)的一個(gè)節(jié)拍點(diǎn)。

    29、該實(shí)施方式,能量峰值點(diǎn)通常為節(jié)拍點(diǎn),在頻率特征點(diǎn)的能量超過預(yù)設(shè)閾值且超過附近時(shí)間的目標(biāo)特征點(diǎn)的能量的情況下,可以說明該頻率特征點(diǎn)為一段時(shí)間內(nèi)的峰值點(diǎn),將該點(diǎn)作為節(jié)拍點(diǎn)可以實(shí)現(xiàn)對節(jié)拍點(diǎn)的準(zhǔn)確識別。

    30、在一種可能的實(shí)施方式中,所述方法還包括訓(xùn)練所述深度學(xué)習(xí)模型的步驟:

    31、獲取音頻數(shù)據(jù)集;所述音頻數(shù)據(jù)集中包括多個(gè)樣本音頻數(shù)據(jù),不同的所述音頻數(shù)據(jù)具有不同的音樂風(fēng)格、不同的音樂節(jié)奏和不同的音樂時(shí)長;

    32、對所述樣本音頻本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種音頻節(jié)拍解析方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,每個(gè)所述特征提取器包括卷積層和注意力提取層;與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器中的卷積層的卷積尺度不同。

    3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,將所述拼接特征數(shù)據(jù)輸入深度學(xué)習(xí)模型,依次經(jīng)過與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器進(jìn)行特征提取后,得到所述音頻數(shù)據(jù)對應(yīng)的節(jié)拍特征,包括:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對音頻數(shù)據(jù)進(jìn)行音頻信號解析處理,得到所述音頻數(shù)據(jù)的幅度譜特征數(shù)據(jù)、音高特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù),包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)每幀所述音頻信號對應(yīng)的頻率特征點(diǎn)的能量,確定所述音頻數(shù)據(jù)的節(jié)奏特征數(shù)據(jù),包括:

    6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)每個(gè)所述頻率特征點(diǎn)的能量和位于所述頻率特征點(diǎn)的預(yù)設(shè)時(shí)間間隔內(nèi)的各個(gè)目標(biāo)特征點(diǎn)的能量,從各個(gè)所述頻率特征點(diǎn)中確定所述音頻數(shù)據(jù)對應(yīng)的各個(gè)節(jié)拍點(diǎn),包括:</p>

    7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括訓(xùn)練所述深度學(xué)習(xí)模型的步驟:

    8.一種車輛,其特征在于,包括控制器,所述控制器包括:

    9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:處理器、存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有所述處理器可執(zhí)行的機(jī)器可讀指令,所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的機(jī)器可讀指令,所述機(jī)器可讀指令被所述處理器執(zhí)行時(shí),所述處理器執(zhí)行如權(quán)利要求1至7任意一項(xiàng)所述的音頻節(jié)拍解析方法的步驟。

    10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品被計(jì)算機(jī)設(shè)備運(yùn)行時(shí),所述計(jì)算機(jī)設(shè)備執(zhí)行如權(quán)利要求1至7任意一項(xiàng)所述的音頻節(jié)拍解析方法的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種音頻節(jié)拍解析方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,每個(gè)所述特征提取器包括卷積層和注意力提取層;與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器中的卷積層的卷積尺度不同。

    3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,將所述拼接特征數(shù)據(jù)輸入深度學(xué)習(xí)模型,依次經(jīng)過與所述幅度譜特征數(shù)據(jù)、所述音高特征數(shù)據(jù)和所述節(jié)奏特征數(shù)據(jù)分別對應(yīng)的特征提取器進(jìn)行特征提取后,得到所述音頻數(shù)據(jù)對應(yīng)的節(jié)拍特征,包括:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對音頻數(shù)據(jù)進(jìn)行音頻信號解析處理,得到所述音頻數(shù)據(jù)的幅度譜特征數(shù)據(jù)、音高特征數(shù)據(jù)和節(jié)奏特征數(shù)據(jù),包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)每幀所述音頻信號對應(yīng)的頻率特征點(diǎn)的能量,確定所述音頻數(shù)據(jù)的節(jié)奏特征數(shù)據(jù),包括:

    ...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:張鵬孫政浩
    申請(專利權(quán))人:集度科技武漢有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕无码不卡免费视频| 中文无码精品一区二区三区| 精品无码久久久久国产| 无码乱人伦一区二区亚洲一 | 久久亚洲AV成人无码| 国产成人无码AV片在线观看| 亚洲成a人片在线观看无码专区| 无码中文字幕av免费放| 亚洲AV成人无码久久精品老人| 无码国产亚洲日韩国精品视频一区二区三区 | 国产精品一区二区久久精品无码| 久久亚洲精品无码AV红樱桃| 国产在线观看无码免费视频| 免费无码AV片在线观看软件| 亚洲av无码国产综合专区| 亚洲国产AV无码专区亚洲AV | 亚洲6080yy久久无码产自国产| 国产成人精品无码免费看| 亚洲精品无码你懂的网站| 久久亚洲精品无码网站| 中文字幕AV无码一区二区三区| 亚洲大尺度无码无码专区| 国产AV无码专区亚洲AV男同| 久久久久亚洲AV无码专区桃色| 国产精品无码亚洲精品2021| 亚洲精品GV天堂无码男同| 久久久久亚洲AV无码麻豆| 久久久国产精品无码免费专区| 人妻少妇无码精品视频区| 日日摸夜夜爽无码毛片精选| 精品久久久久久无码免费| 久久精品无码av| 最新无码A∨在线观看| 亚洲色无码一区二区三区| 亚洲中文字幕无码久久2017| 亚洲国产AV无码专区亚洲AV| 老司机亚洲精品影院无码| 免费A级毛片无码A∨| 一本大道无码av天堂| 用舌头去添高潮无码视频| 久久久久亚洲?V成人无码|