System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国产AV无码专区亚洲A∨毛片,免费无码又爽又黄又刺激网站,无码av免费毛片一区二区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    音頻處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品制造方法及圖紙

    技術(shù)編號:44476121 閱讀:4 留言:0更新日期:2025-03-04 17:45
    本申請公開了一種音頻處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,公開的音頻處理方法:獲取多個待處理音頻文件;對各待處理音頻文件進行質(zhì)量評估,得到各待處理音頻文件的質(zhì)量評估結(jié)果;在質(zhì)量評估結(jié)果為有效音頻的情況下,將對應(yīng)的待處理音頻文件作為有效音頻文件;在質(zhì)量評估結(jié)果為無效音頻的情況下,將對應(yīng)的待處理音頻文件作刪除處理;在質(zhì)量評估結(jié)果為除有效音頻和無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的待處理音頻文件進行自優(yōu)化處理。本申請由于對除有效數(shù)據(jù)和無效數(shù)據(jù)之外的其他數(shù)據(jù)做了自優(yōu)化處理,使得整個數(shù)據(jù)集的質(zhì)量得到了提升,解決了如何提升大模型的多模態(tài)標注數(shù)據(jù)的整體質(zhì)量的問題。

    【技術(shù)實現(xiàn)步驟摘要】

    本申請涉及數(shù)據(jù)處理,尤其涉及一種音頻處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品


    技術(shù)介紹

    1、相關(guān)技術(shù)中,通過對大模型的多模態(tài)標注數(shù)據(jù)進行質(zhì)量評測,將數(shù)據(jù)集中錯誤數(shù)據(jù)和無效數(shù)據(jù)作刪除,來實現(xiàn)多模態(tài)標注數(shù)據(jù)的質(zhì)量監(jiān)控。但是,只將錯誤數(shù)據(jù)和無效數(shù)據(jù)作刪除,仍無法保證數(shù)據(jù)的整體質(zhì)量。因此,如何提升大模型的多模態(tài)標注數(shù)據(jù)的整體質(zhì)量的問題亟待解決。


    技術(shù)實現(xiàn)思路

    1、本申請的主要目的在于提供一種音頻處理方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,旨在解決如何提升大模型的多模態(tài)標注數(shù)據(jù)的整體質(zhì)量的技術(shù)問題。

    2、為實現(xiàn)上述目的,本申請?zhí)岢鲆环N音頻處理方法,音頻處理方法包括:

    3、獲取多個待處理音頻文件;

    4、對各待處理音頻文件進行質(zhì)量評估,得到各待處理音頻文件的質(zhì)量評估結(jié)果;

    5、在質(zhì)量評估結(jié)果為有效音頻的情況下,將對應(yīng)的待處理音頻文件作為有效音頻文件;

    6、在質(zhì)量評估結(jié)果為無效音頻的情況下,將對應(yīng)的待處理音頻文件作刪除處理;

    7、在質(zhì)量評估結(jié)果為除有效音頻和無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的待處理音頻文件進行自優(yōu)化處理。

    8、在一實施例中,多個待處理音頻文件中包括音頻時長小于預(yù)設(shè)時長和/或標注文本長度小于預(yù)設(shè)文本長度的過短音頻文件,質(zhì)量評估結(jié)果包括過短音頻文件的可修復(fù)評分;

    9、在質(zhì)量評估結(jié)果為有效音頻和無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的待處理音頻文件進行自優(yōu)化處理的步驟,包括:p>

    10、將可修復(fù)評分大于或等于預(yù)設(shè)可修復(fù)評分的目標過短音頻文件的目標標注文本與選定音頻文件的選定標注文本拼接,得到第一拼接文本,其中,在可修復(fù)評分大于或等于預(yù)設(shè)可修復(fù)評分的情況下,質(zhì)量評估結(jié)果為除有效音頻和無效音頻之外的其他評估結(jié)果,選定音頻文件包括目標過短音頻文件所在的音頻組中與目標過短音頻文件下標號相鄰的至少一個待處理音頻文件;

    11、根據(jù)第一拼接文本中標點位置,從第一拼接文本中,確定出目標標注文本所在的目標拼接文本;

    12、根據(jù)目標拼接文本中目標標注文本的位置和目標拼接文本,確定第一選定拼接文本和第二選定拼接文本;

    13、根據(jù)第一選定拼接文本的第一完整性概率和第二選定拼接文本的第二完整性概率,從選定音頻文件中確定出目標音頻文件;

    14、合并目標過短音頻文件與目標音頻文件,得到合并音頻文件,以對目標過短音頻文件進行自優(yōu)化處理。

    15、在一實施例中,合并目標過短音頻文件與目標音頻文件,得到合并音頻文件的步驟之后,音頻處理方法還包括:

    16、根據(jù)目標過短音頻文件的第一時間戳和目標音頻文件的第二時間戳,獲得參考時間戳;

    17、若合并音頻文件的合并時間戳與參考時間戳之間的偏差滿足預(yù)設(shè)條件,則將合并音頻文件作為有效音頻文件,以對目標過短音頻文件進行自優(yōu)化處理。

    18、在一實施例中,在質(zhì)量評估結(jié)果為有效音頻和無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的待處理音頻文件進行自優(yōu)化處理的步驟,包括:

    19、若待處理音頻文件的音頻響度值未落入所在音頻組的響度正態(tài)分布曲線的預(yù)設(shè)覆蓋區(qū)域,則對應(yīng)的質(zhì)量評估結(jié)果為有效音頻和無效音頻之外的其他評估結(jié)果,待處理音頻文件為異常響度音頻文件;

    20、獲取響度異常音頻文件的異常音頻響度值與預(yù)設(shè)音頻響度值之間的響度偏差;

    21、根據(jù)響度偏差和調(diào)整限制值之間的較小值,調(diào)整響度異常音頻文件的音頻響度,以對響度異常音頻文件進行自優(yōu)化處理。

    22、在一實施例中,對各待處理音頻文件進行質(zhì)量評估,得到各待處理音頻文件的質(zhì)量評估結(jié)果的步驟,包括:

    23、根據(jù)各待處理音頻文件的聲道數(shù)和采樣率,將多個待處理音頻文件劃分為多個音頻組;

    24、針對各音頻組,根據(jù)音頻組中任一過短音頻文件的任一標注文本與相鄰標注文本的第二拼接文本的連續(xù)性概率,確定任一過短音頻文件的可修復(fù)評分,其中,過短音頻文件為音頻時長小于預(yù)設(shè)時長和/或標注文本長度小于預(yù)設(shè)文本長度的音頻文件,相鄰標注文本為音頻組中與任一過短音頻文件下標號相鄰的相鄰音頻文件的標注文本,相鄰音頻文件包括下標號大于任一過短音頻文件的下標號的第一音頻文件和/或下標號小于任一過短音頻文件的下標號的第二音頻文件;

    25、針對各音頻組,根據(jù)音頻組中過短音頻文件的占比,確定音頻組的過短音頻占比得分;

    26、針對各音頻組,根據(jù)音頻組中落入音頻組的響度正態(tài)分布曲線的預(yù)設(shè)覆蓋區(qū)域的音頻文件概率,得到音頻組的響度得分,其中,響度正態(tài)分布曲線根據(jù)音頻組中各音頻文件的響度平均值和響度標準差構(gòu)建;

    27、針對各音頻組,根據(jù)音頻組中各響度異常音頻文件的異常音頻響度值與預(yù)設(shè)音頻響度值之間的響度差是否在預(yù)設(shè)響度差范圍內(nèi),確定各響度異常音頻文件的異常響度得分;

    28、針對各音頻組,根據(jù)音頻組的各可修復(fù)評分、過短音頻占比得分、響度得分和各異常響度得分,確定音頻組的質(zhì)量評估結(jié)果。

    29、在一實施例中,針對各音頻組,根據(jù)音頻組中任一過短音頻文件的任一標注文本與選定標注文本的拼接文本的連續(xù)性概率,確定任一過短音頻文件的可修復(fù)評分的步驟,包括:

    30、針對各音頻組,若音頻組中任一過短音頻文件的相鄰音頻文件為過短音頻文件,則將任一過短音頻文件的任一標注文本與相鄰音頻文件的相鄰標注文本的第二拼接文本的連續(xù)性概率,作為任一過短音頻文件的可修復(fù)評分;

    31、針對各音頻組,若音頻組中任一過短音頻文件的相鄰音頻文件不是過短音頻文件,則根據(jù)第三拼接文本的連續(xù)性概率,和/或第四拼接文本的連續(xù)性概率,確定可修復(fù)評分,第三拼接文本為任一標注文本與第一音頻文件的第一標注文本的拼接文本,第四拼接文本為任一標注文本與第二音頻文件的第二標注文本的拼接文本。

    32、此外,為實現(xiàn)上述目的,本申請還提出一種音頻處理裝置,音頻處理裝置包括:

    33、獲取模塊,用于獲取多個待處理音頻文件;

    34、評估模塊,用于對各待處理音頻文件進行質(zhì)量評估,得到各待處理音頻文件的質(zhì)量評估結(jié)果;

    35、處理模塊,用于在質(zhì)量評估結(jié)果為有效音頻的情況下,將對應(yīng)的待處理音頻文件作為有效音頻文件;

    36、處理模塊,還用于在質(zhì)量評估結(jié)果為無效音頻的情況下,將對應(yīng)的待處理音頻文件作刪除處理;

    37、處理模塊,還用于在質(zhì)量評估結(jié)果為除有效音頻和無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的待處理音頻文件進行自優(yōu)化處理。

    38、此外,為實現(xiàn)上述目的,本申請還提出一種音頻處理設(shè)備,音頻處理設(shè)備包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,計算機程序配置為實現(xiàn)如上文的音頻處理方法的步驟。

    39、此外,為實現(xiàn)上述目的,本申請還提出一種存儲介質(zhì),存儲介質(zhì)為計算機可讀存儲介質(zhì),存儲介質(zhì)上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)如上文的音頻處理方本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種音頻處理方法,其特征在于,所述音頻處理方法包括:

    2.如權(quán)利要求1所述的音頻處理方法,其特征在于,多個所述待處理音頻文件中包括音頻時長小于預(yù)設(shè)時長和/或標注文本長度小于預(yù)設(shè)文本長度的過短音頻文件,所述質(zhì)量評估結(jié)果包括所述過短音頻文件的可修復(fù)評分;

    3.如權(quán)利要求2所述的音頻處理方法,其特征在于,所述合并所述目標過短音頻文件與所述目標音頻文件,得到合并音頻文件的步驟之后,所述音頻處理方法還包括:

    4.如權(quán)利要求1所述的音頻處理方法,其特征在于,所述在所述質(zhì)量評估結(jié)果為所述有效音頻和所述無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的所述待處理音頻文件進行自優(yōu)化處理的步驟,包括:

    5.如權(quán)利要求1所述的音頻處理方法,其特征在于,所述對各所述待處理音頻文件進行質(zhì)量評估,得到各所述待處理音頻文件的質(zhì)量評估結(jié)果的步驟,包括:

    6.如權(quán)利要求5所述的音頻處理方法,其特征在于,所述針對各所述音頻組,根據(jù)所述音頻組中任一過短音頻文件的任一標注文本與選定標注文本的拼接文本的連續(xù)性概率,確定所述任一過短音頻文件的可修復(fù)評分的步驟,包括:

    7.一種音頻處理裝置,其特征在于,所述音頻處理裝置包括:

    8.一種音頻處理設(shè)備,其特征在于,所述音頻處理設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現(xiàn)如權(quán)利要求1至6中任一項所述的音頻處理方法的步驟。

    9.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)為計算機可讀存儲介質(zhì),所述存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的音頻處理方法的步驟。

    10.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的音頻處理方法的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種音頻處理方法,其特征在于,所述音頻處理方法包括:

    2.如權(quán)利要求1所述的音頻處理方法,其特征在于,多個所述待處理音頻文件中包括音頻時長小于預(yù)設(shè)時長和/或標注文本長度小于預(yù)設(shè)文本長度的過短音頻文件,所述質(zhì)量評估結(jié)果包括所述過短音頻文件的可修復(fù)評分;

    3.如權(quán)利要求2所述的音頻處理方法,其特征在于,所述合并所述目標過短音頻文件與所述目標音頻文件,得到合并音頻文件的步驟之后,所述音頻處理方法還包括:

    4.如權(quán)利要求1所述的音頻處理方法,其特征在于,所述在所述質(zhì)量評估結(jié)果為所述有效音頻和所述無效音頻之外的其他評估結(jié)果的情況下,將對應(yīng)的所述待處理音頻文件進行自優(yōu)化處理的步驟,包括:

    5.如權(quán)利要求1所述的音頻處理方法,其特征在于,所述對各所述待處理音頻文件進行質(zhì)量評估,得到各所述待處理音頻文件的質(zhì)量評估結(jié)果的步驟,包括:

    6.如權(quán)利要求5所述的音頻處理...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:吳坤劉仲舉李珍余文虎陳卓王冀彬陶濤
    申請(專利權(quán))人:中移動信息技術(shù)有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲?v无码国产在丝袜线观看 | 久久久久久久亚洲Av无码| 免费无码又爽又刺激一高潮| 无码专区中文字幕无码| 无码射肉在线播放视频| 野花在线无码视频在线播放| 无码日本精品XXXXXXXXX| 国产精品99精品无码视亚| 精品无码中文视频在线观看| 777爽死你无码免费看一二区 | 久久精品无码专区免费| 精品国产一区二区三区无码| 自拍中文精品无码| 免费人妻av无码专区| 在线看片福利无码网址| 十八禁无码免费网站| 亚洲精品午夜无码专区| 亚洲中文字幕无码爆乳av中文| 亚洲精品无码中文久久字幕| 日韩人妻精品无码一区二区三区 | 一区二区三区人妻无码| 人妻无码一区二区三区四区| 亚洲AV无码成人精品区日韩 | 国产在线无码不卡影视影院| 精品人妻无码专区中文字幕| 精品人妻系列无码人妻漫画 | 亚洲中文字幕无码爆乳av中文| 18禁无遮挡无码国产免费网站| 小13箩利洗澡无码视频网站| 国产a级理论片无码老男人| 国产色爽免费无码视频| 九九久久精品无码专区| 波多野结衣AV无码| 国产成人无码一区二区三区| 亚洲精品无码mv在线观看网站| 无码人妻精品中文字幕免费| 十八禁无码免费网站| 亚洲中文无码永久免费| 久久久久久99av无码免费网站| 久久AV无码精品人妻出轨| 亚洲精品97久久中文字幕无码 |