System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲AV中文无码乱人伦,中文无码字幕中文有码字幕,性无码专区无码片
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>山西大學專利>正文

    一種用于深度學習說話人驗證的分數域特征提取方法、設備及介質技術

    技術編號:43964120 閱讀:27 留言:0更新日期:2025-01-07 21:49
    本發明專利技術屬于聲紋識別技術領域,特別涉及一種用于深度學習說話人驗證的分數域特征提取方法、設備及介質。包括以下步驟:對語音信號進行預處理;對選定窗函數分別使用提取自分數階傅里葉變換的不同階數的調制因子獲取分數階窗函數;對語音信號分別進行短時傅里葉變換,得到功率譜頻譜圖;對所得功率譜頻譜圖,分別通過梅爾濾波器組進行濾波并取對數,得到M維濾波器組特征;對Fbank特征,統一分配初始值為1的可學習參數作為權重,并使用softmax激活函數限制權重總和不變;對加權Fbank特征,按階次從高到低在時間維上串聯拼接為一個多窗分數階Fbank特征,使用該特征輸入深度學習模型進行訓練;本發明專利技術突出不同階次特征的重要性,能有效的提高深度學習說話人驗證系統的準確性。

    【技術實現步驟摘要】

    本專利技術屬于聲紋識別,特別涉及一種用于深度學習說話人驗證的分數域特征提取方法、設備及介質


    技術介紹

    1、說話人驗證屬于聲紋識別領域范疇,即給定兩個音頻,判定它們是否為同一個人所說。傳統的說話人驗證系統主要依賴于從語音信號中提取特征來表示說話人的身份信息。常用的特征提取方法包括濾波器組特征(fbank)和梅爾頻率倒譜系數(mfcc)。fbank特征通過模擬人耳的聽覺特性,使用一組濾波器來分析語音信號的頻譜能量分布。mfcc則在fbank的基礎上進行了進一步的處理,通過離散余弦變換(dct)來降低特征之間的相關性。這些方法雖然在實踐中證明了其有效性,但仍然存在一些局限性,如難以充分捕捉語音信號中的細微差異和動態特征。

    2、近年來,深度學習技術在語音處理領域取得了顯著進展。卷積神經網絡(cnn)和時延神經網絡(tdnn)等模型被廣泛應用于說話人驗證任務中。cnn通過其局部連接和權值共享的特性,能夠有效地學習語音信號的時頻結構。tdnn則通過考慮輸入特征的時間依賴關系,更好地捕捉語音的動態特征。這些深度學習模型在一定程度上提高了系統的性能,但仍然面臨著如何更有效地提取和利用語音信號中的豐富信息的挑戰。


    技術實現思路

    1、本專利技術的目的在于提供一種用于深度學習說話人驗證的分數域特征提取方法,能夠利用多階次的分數階窗函數提供比傳統特征更靈活和全面的信息,在時頻平面上提供更豐富的信號表示,將這種分數域特征與現有的深度學習模型結合有潛力揭示傳統方法難以捕捉的語音信號微妙特征。p>

    2、為達到上述目的,本專利技術采用的技術方案是:

    3、一種用于深度學習說話人驗證的分數域特征提取方法,包括以下步驟:

    4、s1、對語音信號進行預加重增強高頻部分;

    5、具體的,選0.97的預加重系數進行如下預加重:

    6、x(t)=x0(t)-0.97*x0(t-1)

    7、其中為x0(t)原始語音信號,x(t)為預加重后語音信號;

    8、s2、對選定窗函數分別使用提取自分數階傅里葉變換的n個不同階數的調制因子獲取分數階窗函數;

    9、具體的,所述分數階傅里葉變換表示為:

    10、

    11、核函數kp(t,u)可表示為

    12、

    13、其中時頻面的旋轉角度

    14、對核函數公式做變換,并使用窗函數w(t)加窗,得到

    15、

    16、所述分數階窗函數由原窗函數與調制因子結合得到,表示為:

    17、

    18、具體的,w(t)為漢明(hamming)窗表示為:

    19、

    20、窗函數長度n=400;

    21、階數分別為p1=1,p2=0.8,p3=0.6,p4=0.4,p5=0.2;

    22、s3、對每一語音信號分別使用5個不同階數的分數階窗函數獲取功率譜頻譜圖;

    23、對所得功率譜頻譜圖,提取m維濾波器組(fbank)特征;

    24、所述5個分數階窗函數的階數為p1=1,p2=0.8,p3=0.6,p4=0.4,p5=0.2;

    25、具體的,提取功率譜頻譜圖步驟包括以下步驟:

    26、分幀:將輸入語音信號分割為有重疊的片段,片段長度與窗函數長度一致;

    27、加窗:每幀語音信號分別使用5個不同階次的分數階窗函數加窗;

    28、執行快速傅里葉變換,對每一幀進行快速傅里葉變換,將時域信號轉換為頻域;計算功率譜;取快速傅里葉變換結果的模的平方,然后除以信號長度進行歸一化;

    29、生成頻譜圖:將每一幀的頻譜按時間順序排列,形成二維的頻譜圖;

    30、所述提取功率譜密度表示為:

    31、

    32、每一語音信號分別使用5個不同階次的分數階窗函數加窗;

    33、s4、對功率譜頻譜圖,使用m維梅爾濾波器組并取對數提取濾波器組(fbank)特征;

    34、具體的,每個功率譜頻譜圖提取一個m維fbank特征,即建立語音信號個數×n個m維fbank特征;

    35、所述fbank特征表示為:

    36、

    37、其中hl[k]為80維梅爾濾波器組,l=1,2,...,80表示梅爾濾波器序號索引,m=1,2,...,t表示時間維的索引,r為幀移,∈為極小的正數,用于避免取對數時出現零或負值

    38、根據每一語音信號的n個功率譜頻譜圖提取fbank特征,包括以下步驟:

    39、對所述功率譜頻譜圖應用梅爾濾波器組hl[k];這些濾波器在梅爾頻率尺度上均勻分布的,模擬了人耳對不同頻率的敏感度;l=1,2,...,l表示梅爾濾波器序號索引;

    40、s5、對n個fbank特征分別加權,并用softmax激活函數限制權重總和不變;

    41、具體的,所述對n個fbank特征分別加權,并用softmax激活函數限制權重總和不變,包括以下步驟:

    42、對每組特征進行零均值化處理;即對每組特征減去其均值,使得特征的均值為0,特征的分布中心對齊到零點;

    43、初始化權重參數;為n個fbank特征分別初始化原始權重參數;

    44、共初始化5個原始權重參數w1,w2,w3,w4,w5,初始值均設為1.0;

    45、使用softmax激活函數限制權重:將原始權重參數堆疊成一個向量后,使用softmax函數對該向量進行歸一化,并乘以原始權重數量,確保權重總和恒定;乘以5以確保權重總和恒定為5;所述softmax函數表示為:

    46、

    47、s6、對n個加權fbank特征,按階次從高到低在時間維上串聯拼接為一個多窗分數階fbank特征,使用該特征輸入深度學習模型進行訓練;

    48、具體的,所述對n個加權fbank特征,按階次從高到低在時間維上串聯拼接為一個多窗分數階fbank特征,表示為:

    49、c[l,m]=5·softmax[w1·f1[l,m];w2·f2[l,m];w3·f3[l,m];w4·f4[l,m];w5·f5[l,m]]

    50、具體的,使用該多窗分數階fbank特征輸入深度學習模型進行訓練包括以下步驟:

    51、選定模型:選定tdnn模型和ecapa-tdnn模型分別搭配傳統fbank特征和所述多窗分數階fbank特征進行訓練;

    52、設定訓練超參數:輸入語音信號片段長度為200ms,最大訓練輪數(epoch)為max_epoch=100,批次大小為batch_size=64;采用adam優化器,權重衰減為weight_decay=1e-4,學習率衰減策略為預熱余弦退火;

    53、選定訓練集數據:選取voxceleb1語音數據集作為訓練集;

    54、輸入特征進行訓練:設置一個布爾型標志freeze_weights,初始值為false,用于本文檔來自技高網...

    【技術保護點】

    1.一種用于深度學習說話人驗證的分數域特征提取方法,其特征在于,包括以下步驟:

    2.一種處理設備,其特征在于,包括:

    3.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,當計算機程序被處理器執行時能實現權利要求1所述方法中的步驟。

    【技術特征摘要】

    1.一種用于深度學習說話人驗證的分數域特征提取方法,其特征在于,包括以下步驟:

    2.一種處理設備,其特征在于,包括:

    【專利技術屬性】
    技術研發人員:徐麗云何怡帆
    申請(專利權)人:山西大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码中文字幕av免费放| 99久久人妻无码精品系列| 亚洲v国产v天堂a无码久久| 一级电影在线播放无码| 国产成人无码精品久久久久免费| 无码专区中文字幕无码| 午夜无码中文字幕在线播放 | 久久久久久国产精品无码下载 | 无码人妻精品内射一二三AV| 丰满少妇人妻无码| 免费无码AV电影在线观看| 性无码一区二区三区在线观看| 免费无码又黄又爽又刺激| 2024你懂的网站无码内射| 十八禁无码免费网站| 亚洲日韩av无码| 在线观看免费无码专区| 特级无码毛片免费视频| 日韩中文无码有码免费视频| 亚洲精品无码久久久久秋霞| 日韩av无码久久精品免费| 中文字幕无码久久人妻| 国产成人无码av片在线观看不卡| 国产成人无码免费视频97| 免费无码黄网站在线观看| 成年男人裸j照无遮挡无码| 国产莉萝无码AV在线播放| 亚洲最大中文字幕无码网站| 伊人天堂av无码av日韩av| 亚洲AV永久无码精品网站在线观看| 人妻少妇精品无码专区二区 | 中文字幕人妻无码专区| 日韩精品无码免费专区午夜不卡 | MM1313亚洲精品无码久久| 无码精品一区二区三区| 性色av无码不卡中文字幕 | 人妻无码中文字幕| 国产真人无码作爱免费视频| 自拍偷在线精品自拍偷无码专区 | 国产精品无码免费播放| 精品久久久无码人妻字幂|