• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    音頻數據處理方法、裝置、設備以及介質制造方法及圖紙

    技術編號:36765487 閱讀:22 留言:0更新日期:2023-03-08 21:20
    本申請實施例提供了一種音頻數據處理方法、裝置、設備以及介質,方法包括:獲取錄音音頻;錄音音頻包括背景基準音頻分量、語音音頻分量以及環境噪聲分量;獲取錄音音頻的待匹配音頻指紋,根據待匹配音頻指紋在音頻數據庫中獲取與錄音音頻相匹配的原型音頻;根據原型音頻從錄音音頻中獲取候選語音音頻;候選語音音頻包括語音音頻分量和環境噪聲分量;將錄音音頻與候選語音音頻之間的差值,確定為錄音音頻中所包含的背景基準音頻分量;對候選語音音頻進行環境噪聲降噪處理,得到候選語音音頻對應的降噪語音音頻,將降噪語音音頻與背景基準音頻分量進行合并,得到降噪后的錄音音頻。采用本申請,可以提升錄音音頻的降噪效果。可以提升錄音音頻的降噪效果。可以提升錄音音頻的降噪效果。

    【技術實現步驟摘要】
    音頻數據處理方法、裝置、設備以及介質


    [0001]本申請涉及音頻處理
    ,尤其涉及一種音頻數據處理方法、裝置、設備以及介質。

    技術介紹

    [0002]隨著音視頻業務應用的迅速推廣普及,用戶使用音頻業務應用分享日常音樂錄音的頻率日益增加。例如,當用戶聽著伴唱唱歌,通過具有錄音功能的設備(例如手機或者接入麥克風的聲卡設備)進行錄音時,該用戶可能處在嘈雜的環境中,或者使用的設備過于簡易,這就導致該設備所錄制的音樂錄音信號除了包括用戶的歌聲(人聲信號)、伴唱(音樂信號)之外,還可能會引入嘈雜環境中的噪聲信號、設備中的電子噪聲信號等。若是直接將未處理的音樂錄音信號分享至音頻業務應用,會導致其余用戶在音頻業務應用中播放音樂錄音信號時很難聽清用戶的歌聲,因此需要對所錄制的音樂錄音信號進行降噪處理。
    [0003]目前的降噪算法需要明確噪聲類型和信號類型,如基于人聲和噪聲從信號相關性、頻譜分布特征上具有一定的特征距離,通過一些統計降噪或者深度學習降噪的方法進行噪聲抑制。然而,音樂信號的類型較多(例如,古典音樂、民族音樂、搖滾音樂等),有些音樂類型與一些環境噪聲類型相似,或者一些音樂頻譜特征與一些噪聲比較接近,采用上述降噪算法對音樂錄音信號進行降噪處理時,可能會將音樂信號誤判為噪聲信號進行抑制,或者將噪聲信號誤判別音樂信號進行保留,造成音樂錄音信號的降噪效果并不理想。

    技術實現思路

    [0004]本申請實施例提供一種音頻數據處理方法、裝置、設備以及介質,可以提升錄音音頻的降噪效果。
    [0005]本申請實施例一方面提供了一種音頻數據處理方法,包括:
    [0006]獲取錄音音頻;錄音音頻包括背景基準音頻分量、語音音頻分量以及環境噪聲分量;
    [0007]獲取錄音音頻對應的待匹配音頻指紋,根據待匹配音頻指紋在音頻數據庫中獲取與錄音音頻相匹配的原型音頻;
    [0008]根據原型音頻從錄音音頻中獲取候選語音音頻;候選語音音頻包括語音音頻分量和環境噪聲分量;
    [0009]將錄音音頻與候選語音音頻之間的差值,確定為錄音音頻中所包含的背景基準音頻分量;
    [0010]對候選語音音頻進行環境噪聲降噪處理,得到候選語音音頻對應的降噪語音音頻,將降噪語音音頻與背景基準音頻分量進行合并,得到降噪后的錄音音頻。
    [0011]本申請實施例一方面提供了一種音頻數據處理方法,包括:
    [0012]獲取語音樣本音頻、噪聲樣本音頻以及標準樣本音頻,根據語音樣本音頻、噪聲樣本音頻以及標準樣本音頻,生成樣本錄音音頻;語音樣本音頻和噪聲樣本音頻是通過錄音
    采集得到的,標準樣本音頻是音頻數據庫中所存儲的純凈音頻;
    [0013]根據第一初始網絡模型獲取樣本錄音音頻中的樣本預測語音音頻;第一初始網絡模型用于過濾樣本錄音音頻所包含的標準樣本音頻,第一初始網絡模型的期望預測語音音頻由語音樣本音頻和噪聲樣本音頻所確定;
    [0014]根據第二初始網絡模型獲取樣本預測語音音頻對應的樣本預測降噪音頻;第二初始網絡模型用于抑制樣本預測語音音頻所包含的噪聲樣本音頻,第二初始網絡模型的期望預測降噪音頻由語音樣本音頻所確定;
    [0015]基于樣本預測語音音頻和期望預測語音音頻,對第一初始網絡模型的網絡參數進行調整,得到第一深度網絡模型;第一深度網絡模型用于對錄音音頻進行過濾后得到候選語音音頻,錄音音頻包括背景基準音頻分量、語音音頻分量以及環境噪聲分量,候選語音音頻包括語音音頻分量和環境噪聲分量;
    [0016]基于樣本預測降噪音頻和期望預測降噪音頻,對第二初始網絡模型的網絡參數進行調整,得到第二深度網絡模型;第二深度網絡模型用于對候選語音音頻進行降噪處理后得到降噪語音音頻。
    [0017]本申請實施例一方面提供了一種音頻數據處理裝置,包括:
    [0018]音頻獲取模塊,用于獲取錄音音頻;錄音音頻包括背景基準音頻分量、語音音頻分量以及環境噪聲分量;
    [0019]指紋檢索模塊,用于獲取錄音音頻對應的待匹配音頻指紋,根據待匹配音頻指紋在音頻數據庫中獲取與錄音音頻相匹配的原型音頻;
    [0020]音頻過濾模塊,用于根據原型音頻從錄音音頻中獲取候選語音音頻;候選語音音頻包括語音音頻分量和環境噪聲分量;
    [0021]音頻確定模塊,用于將錄音音頻與候選語音音頻之間的差值,確定為錄音音頻中所包含的背景基準音頻分量;
    [0022]降噪處理模塊,用于對候選語音音頻進行環境噪聲降噪處理,得到候選語音音頻對應的降噪語音音頻,將降噪語音音頻與背景基準音頻分量進行合并,得到降噪后的錄音音頻。
    [0023]其中,指紋檢索模塊包括:
    [0024]頻域變換單元,用于將錄音音頻劃分為M個錄音數據幀,對M個錄音數據幀中的第i個錄音數據幀進行頻域變換,得到第i個錄音數據幀對應的功率譜數據;i和M均為正整數,且i小于或等于M;
    [0025]頻譜帶劃分單元,用于將第i個錄音數據幀對應的功率譜數據劃分為N個頻譜帶,根據N個頻譜帶中的峰值信號,構建第i個錄音數據幀對應的子指紋信息;N為正整數;
    [0026]音頻指紋組合單元,用于按照M個錄音數據幀在錄音音頻中的時間順序,對M個錄音數據幀分別對應的子指紋信息進行組合,得到錄音音頻對應的待匹配音頻指紋;
    [0027]原型音頻匹配單元,用于獲取音頻數據庫對應的音頻指紋庫,根據待匹配音頻指紋在音頻指紋庫中進行指紋檢索,根據指紋檢索結果在音頻數據庫中確定與錄音音頻相匹配的原型音頻。
    [0028]其中,原型音頻匹配單元具體用于:
    [0029]將待匹配音頻指紋中所包含的M個子指紋信息映射為M個待匹配哈希值,獲取M個
    待匹配哈希值分別對應的錄音時間;一個待匹配哈希值所對應的錄音時間用于表征該待匹配哈希值對應的子指紋信息在錄音音頻中出現的時間;
    [0030]若M個待匹配哈希值中的第p個待匹配哈希值與音頻指紋庫所包含的第一哈希值相匹配,則獲取第p個待匹配哈希值對應的錄音時間與第一哈希值對應的時間信息之間的第一時間差;p為小于或等于M的正整數;
    [0031]若M個待匹配哈希值中的第q個待匹配哈希值與音頻指紋庫所包含的第二哈希值相匹配,則獲取第q個待匹配哈希值對應的錄音時間與第二哈希值對應的時間信息之間的第二時間差;q為小于或等于M的正整數;
    [0032]當第一時間差和第二時間差滿足數值閾值,且第一哈希值和第二哈希值屬于相同的音頻指紋時,將第一哈希值所屬的音頻指紋確定為指紋檢索結果,將指紋檢索結果所對應的音頻數據確定為錄音音頻對應的原型音頻。
    [0033]其中,音頻過濾模塊包括:
    [0034]歸一化處理單元,用于獲取錄音音頻對應的錄音功率譜數據,對錄音功率譜數據進行歸一化處理,得到第一頻譜特征;
    [0035]上述歸一化處理單元,還用于獲取原型音頻對應的原型功率譜數據,對原型功率譜數據進行歸一化處理,得到第二頻譜特征,將第一頻譜特征和第二頻譜特征組合為輸入特征;
    [0036]第一頻點增本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種音頻數據處理方法,其特征在于,包括:獲取錄音音頻;所述錄音音頻包括背景基準音頻分量、語音音頻分量以及環境噪聲分量;獲取所述錄音音頻對應的待匹配音頻指紋,根據所述待匹配音頻指紋在音頻數據庫中獲取與所述錄音音頻相匹配的原型音頻;根據所述原型音頻從所述錄音音頻中獲取候選語音音頻;所述候選語音音頻包括所述語音音頻分量和所述環境噪聲分量;將所述錄音音頻與所述候選語音音頻之間的差值,確定為所述錄音音頻中所包含的所述背景基準音頻分量;對所述候選語音音頻進行環境噪聲降噪處理,得到所述候選語音音頻對應的降噪語音音頻,將所述降噪語音音頻與所述背景基準音頻分量進行合并,得到降噪后的錄音音頻。2.根據權利要求1所述的方法,其特征在于,所述獲取所述錄音音頻對應的待匹配音頻指紋,根據所述待匹配音頻指紋在音頻數據庫中獲取與所述錄音音頻相匹配的原型音頻,包括:將所述錄音音頻劃分為M個錄音數據幀,對所述M個錄音數據幀中的第i個錄音數據幀進行頻域變換,得到所述第i個錄音數據幀對應的功率譜數據;i和M均為正整數,且i小于或等于M;將所述第i個錄音數據幀對應的功率譜數據劃分為N個頻譜帶,根據所述N個頻譜帶中的峰值信號,構建所述第i個錄音數據幀對應的子指紋信息;N為正整數;按照所述M個錄音數據幀在所述錄音音頻中的時間順序,對所述M個錄音數據幀分別對應的子指紋信息進行組合,得到所述錄音音頻對應的待匹配音頻指紋;獲取所述音頻數據庫對應的音頻指紋庫,根據所述待匹配音頻指紋在所述音頻指紋庫中進行指紋檢索,根據指紋檢索結果在所述音頻數據庫中確定與所述錄音音頻相匹配的原型音頻。3.根據權利要求2所述的方法,其特征在于,所述根據所述待匹配音頻指紋在所述音頻指紋庫中進行指紋檢索,根據指紋檢索結果在所述音頻數據庫中確定與所述錄音音頻相匹配的原型音頻,包括:將所述待匹配音頻指紋中所包含的M個子指紋信息映射為M個待匹配哈希值,獲取所述M個待匹配哈希值分別對應的錄音時間;一個待匹配哈希值所對應的錄音時間用于表征該待匹配哈希值對應的子指紋信息在所述錄音音頻中出現的時間;若所述M個待匹配哈希值中的第p個待匹配哈希值與所述音頻指紋庫所包含的第一哈希值相匹配,則獲取所述第p個待匹配哈希值對應的錄音時間與所述第一哈希值對應的時間信息之間的第一時間差;p為小于或等于M的正整數;若所述M個待匹配哈希值中的第q個待匹配哈希值與所述音頻指紋庫所包含的第二哈希值相匹配,則獲取所述第q個待匹配哈希值對應的錄音時間與所述第二哈希值對應的時間信息之間的第二時間差;q為小于或等于M的正整數;當所述第一時間差和所述第二時間差滿足數值閾值,且所述第一哈希值和所述第二哈希值屬于相同的音頻指紋時,將所述第一哈希值所屬的音頻指紋確定為所述指紋檢索結果,將所述指紋檢索結果所對應的音頻數據確定為所述錄音音頻對應的原型音頻。
    4.根據權利要求1所述的方法,其特征在于,所述根據所述原型音頻從所述錄音音頻中獲取候選語音音頻,包括:獲取所述錄音音頻對應的錄音功率譜數據,對所述錄音功率譜數據進行歸一化處理,得到第一頻譜特征;獲取所述原型音頻對應的原型功率譜數據,對所述原型功率譜數據進行歸一化處理,得到第二頻譜特征,將所述第一頻譜特征和所述第二頻譜特征組合為輸入特征;將所述輸入特征輸入至第一深度網絡模型,通過所述第一深度網絡模型輸出針對所述錄音音頻的第一頻點增益;根據所述第一頻點增益和所述錄音功率譜數據,獲取所述錄音音頻中所包含的候選語音音頻。5.根據權利要求4所述的方法,其特征在于,所述將所述輸入特征輸入至第一深度網絡模型,通過所述第一深度網絡模型輸出第一頻點增益,包括:將所述輸入特征輸入至第一深度網絡模型,根據所述第一深度網絡模型中的特征提取網絡層,獲取所述輸入特征對應的時序分布特征;根據所述第一深度網絡模型中的全連接網絡層,獲取所述時序分布特征對應的目標特征向量,通過所述第一深度網絡模型中的激活層,輸出所述第一頻點增益。6.根據權利要求4所述的方法,其特征在于,所述第一頻點增益包括T個頻點分別對應的語音增益,所述錄音功率譜數據包括所述T個頻點分別對應的能量值,T個語音增益與T個能量值一一對應;T為大于1的正整數;所述根據所述第一頻點增益和所述錄音功率譜數據,獲取所述錄音音頻中所包含的候選語音音頻,包括:根據所述第一頻點增益中的所述T個頻點分別對應的語音增益,對所述錄音功率譜數據中屬于相同頻點的能量值進行加權,得到所述T個頻點分別對應的加權能量值;根據所述T個頻點分別對應的加權能量值,確定所述錄音音頻對應的加權錄音頻域信號;對所述加權錄音頻域信號進行時域變換,得到所述錄音音頻中所包含的所述候選語音音頻。7.根據權利要求1所述的方法,其特征在于,所述對所述候選語音音頻進行環境噪聲降噪處理,得到所述候選語音音頻對應的降噪語音音頻,包括:獲取所述候選語音音頻對應的語音功率譜數據,將所述語音功率譜數據輸入至第二深度網絡模型,通過所述第二深度網絡模型輸出針對所述候選語音音頻的第二頻點增益;根據所述第二頻點增益與所述語音功率譜數據,獲取所述候選語音音頻對應的加權語音頻域信號;對所述加權語音頻域信號進行時域變換,得到所述候選語音音頻對應的所述降噪語音音頻。8.根據權利要求1所述的方法,其特征在于,還包括...

    【專利技術屬性】
    技術研發人員:梁俊斌
    申請(專利權)人:騰訊科技深圳有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久精品中文字幕无码| 久久AV高清无码| 亚洲美日韩Av中文字幕无码久久久妻妇| 亚洲爆乳无码精品AAA片蜜桃| 国产午夜无码福利在线看网站| 在线观看免费无码专区 | 少妇人妻偷人精品无码AV | 中文字幕av无码不卡| 无码aⅴ精品一区二区三区浪潮| 中文字幕无码高清晰| 亚洲欧洲精品无码AV| 蜜臀亚洲AV无码精品国产午夜.| 手机永久无码国产AV毛片 | 潮喷失禁大喷水无码| 永久免费av无码网站大全| av无码免费一区二区三区| 亚洲AV永久纯肉无码精品动漫| 免费无码不卡视频在线观看| 无码国产精品一区二区免费虚拟VR| 亚洲AV中文无码乱人伦下载| 成人无码区免费A∨直播| 人妻无码aⅴ不卡中文字幕| 亚洲av无码专区在线观看亚| 无码H黄肉动漫在线观看网站| 亚洲av无码国产精品色午夜字幕| 亚洲精品无码永久在线观看你懂的| 无码8090精品久久一区| 无码丰满熟妇浪潮一区二区AV| 四虎国产精品永久在线无码| 久久久无码精品人妻一区| 一本色道久久综合无码人妻 | 免费无码成人AV片在线在线播放| 久久久久久精品无码人妻| 亚洲ⅴ国产v天堂a无码二区| 亚洲成A人片在线观看无码不卡| 亚洲热妇无码AV在线播放| 无码国内精品久久人妻| 69久久精品无码一区二区| 亚洲AV永久无码精品放毛片| 国语成本人片免费av无码| 亚洲乱亚洲乱少妇无码|