本發(fā)明專利技術(shù)公開了一種音頻處理的方法和裝置,涉及計算機領(lǐng)域,能夠自動地截取音頻的高潮部分。所述方法包括:根據(jù)音頻文件的頻譜圖,自動確定所述音頻文件的高潮部分的起點和終點;輸出所述起點和所述終點之間的音頻。本發(fā)明專利技術(shù)用于制作音頻。
【技術(shù)實現(xiàn)步驟摘要】
音頻處理的方法和裝置
本專利技術(shù)涉及計算機領(lǐng)域,特別涉及一種音頻處理的方法和裝置。
技術(shù)介紹
隨著互聯(lián)網(wǎng)的普及和不斷發(fā)展,人們已經(jīng)越來越多地通過互聯(lián)網(wǎng)來下載自己喜歡的鈴聲。當前互聯(lián)網(wǎng)上的鈴聲主要是依賴人工通過手動截取音頻的高潮部分的方式而制作的。但是,這種制作鈴聲的方式并不能準確地截取音頻的高潮部分,且需要花費大量的人工成本。
技術(shù)實現(xiàn)思路
本專利技術(shù)實施例提供一種音頻處理的方法和裝置,能夠自動地截取音頻的高潮部分,節(jié)省人工成本。第一方面,提供一種音頻處理的方法,所述方法包括:根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點;輸出所述起點和所述終點之間的音頻。其中,可選地,所述根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點可包括:根據(jù)音頻文件的波形圖,確定所述波形圖上振幅值大于振幅閾值的數(shù)據(jù)點,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,并選取面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間,作為所述音頻文件的高潮部分的起點和終點。可選地,在本專利技術(shù)的一個實施例中,所述方法還包括:預先設(shè)置所述音頻文件的高潮部分的最小時長;所述選取面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間,作為所述音頻文件的高潮部分的起點和終點包括:確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點。在本專利技術(shù)的另一個實施例中,進一步地,所述波形圖是利用波形壓縮比進行平滑處理后得到的波形圖,其中,所述波形壓縮比是指,在對所述音頻文件的波形進行平滑處理的過程中,在每個數(shù)據(jù)點的鄰域內(nèi)所選取的數(shù)據(jù)點數(shù)目;所述方法還可包括:若所述差值小于所述最小時長,則調(diào)高波形壓縮比,并執(zhí)行以下步驟:a、重新根據(jù)所述音頻文件的波形圖,確定所述波形圖上振幅值大于振幅閾值的數(shù)據(jù)點,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;b、確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;c、若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點;d、若差值仍小于所述最小時長,則繼續(xù)調(diào)高波形壓縮比,重復執(zhí)行步驟a-c直至差值大于或等于所述最小時長。在本專利技術(shù)的另一個實施例中,進一步地,所述方法還可包括:預先設(shè)置最大波形壓縮比;若使用的波形壓縮比大于所述最大波形壓縮比,則調(diào)低所述振幅閾值,并執(zhí)行以下步驟;e、根據(jù)音頻文件的波形圖,確定所述波形圖上大于調(diào)整后的振幅閾值的振幅值,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;f、確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;g、若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點;h、若差值小于所述最小時長,則繼續(xù)調(diào)低所述振幅閾值,并執(zhí)行步驟e-g直至差值大于或等于所述最小時長。其中,在本專利技術(shù)的一個實施例中,在所述根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點之前,所述方法還可包括:確定整個波形圖中的振幅平均值;根據(jù)所述振幅平均值,確定振幅閾值。第二方面,提供一種音頻處理的裝置,所述裝置包括:處理模塊,用于根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點;輸出模塊,用于輸出所述起點和所述終點之間的音頻。其中,可選地,所述處理模塊具體用于:根據(jù)音頻文件的波形圖,確定所述波形圖上振幅值大于振幅閾值的數(shù)據(jù)點,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,并選取面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間,作為所述音頻文件的高潮部分的起點和終點。可選地,在本專利技術(shù)的一個實施例中,所述裝置還包括:設(shè)置模塊,用于預先設(shè)置所述音頻文件的高潮部分的最小時長;當選取面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間,作為所述音頻文件的高潮部分的起點和終點時,所述處理模塊具體用于:確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;若差值大于或等于所述設(shè)置模塊設(shè)置的最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點。在本專利技術(shù)的另一個實施例中,進一步地,所述波形圖是利用波形壓縮比進行平滑處理后得到的波形圖,其中,所述波形壓縮比是指,在對所述音頻文件的波形進行平滑處理的過程中,在每個數(shù)據(jù)點的領(lǐng)域內(nèi)所選取的數(shù)據(jù)點數(shù)目;所述處理模塊,還用于若所述差值小于所述最小時長,則調(diào)高波形壓縮比,并執(zhí)行以下步驟:a、重新根據(jù)所述音頻文件的波形圖,確定所述波形圖上振幅值大于振幅閾值的數(shù)據(jù)點,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;b、確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;c、若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點;d、若差值仍小于所述最小時長,則繼續(xù)調(diào)高波形壓縮比,重復執(zhí)行步驟a-c直至差值大于或等于所述最小時長。在本專利技術(shù)的另一個實施例中,進一步地,所述設(shè)置模塊,還用于預先設(shè)置最大波形壓縮比;所述處理模塊,還用于若使用的波形壓縮比大于所述設(shè)置模塊設(shè)置的最大波形壓縮比,則調(diào)低所述振幅閾值,并執(zhí)行以下步驟:e、根據(jù)音頻文件的波形圖,確定所述波形圖上大于調(diào)整后的振幅閾值的振幅值,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;f、確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;g、若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點;h、若差值小于所述最小時長,則繼續(xù)調(diào)低所述振幅閾值,并執(zhí)行步驟e-g直至差值大于或等于所述最小時長。其中,可選地在本專利技術(shù)的一個實施例中,所述處理模塊還用于:確定整個波形圖中的振幅平均值;根據(jù)所述振幅平均值,確定振幅閾值。本專利技術(shù)實施例提供的音頻處理的方法和裝置,根據(jù)音頻文件的波形圖來確定所述音頻文件的高潮部分的起點和終點,相比于相關(guān)技術(shù)手動確定高潮部分起點和終點的方式,提高了精確度,且能夠自動地截取音頻的高潮部分,節(jié)省人工成本。附圖說明為了更清楚地說明本專利技術(shù)實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術(shù)的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本專利技術(shù)實施例提供的一種音頻處理的方法的流程圖;圖2A是本專利技術(shù)實施例提供的另一種音頻處理的方法的流程圖;圖2B是本專利技術(shù)實施例提供的一種示意波形圖;圖3是本專利技術(shù)實施例提供的另一種音頻處理的方法的流程圖;圖4A是本專利技術(shù)實施例提供的音頻處理的裝置的結(jié)構(gòu)示意圖;圖4B是本專利技術(shù)實施例提供的音頻處理的裝置的結(jié)構(gòu)示意圖。具體實施方式為使本專利技術(shù)的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本專利技術(shù)實施方式作進一步地詳細描述。圖1是本專利技術(shù)實施例提供的一種音頻處理的方法的流程圖。參照圖1,本專利技術(shù)實施例提供的音頻處理的方法可包括:11、根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點;12、輸出所述起點和所述終點之間本文檔來自技高網(wǎng)...

【技術(shù)保護點】
一種音頻處理的方法,其特征在于,所述方法包括:根據(jù)音頻文件的頻譜圖,自動確定所述音頻文件的高潮部分的起點和終點;輸出所述起點和所述終點之間的音頻。
【技術(shù)特征摘要】
1.一種音頻處理的方法,其特征在于,所述方法包括:根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點;輸出所述起點和所述終點之間的音頻;所述根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點包括:根據(jù)音頻文件的波形圖,確定所述波形圖上振幅值大于振幅閾值的數(shù)據(jù)點,其中,所述波形圖上連續(xù)的所述數(shù)據(jù)點形成一簇數(shù)據(jù)點;確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,并選取面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間,作為所述音頻文件的高潮部分的起點和終點。2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括:預先設(shè)置所述音頻文件的高潮部分的最小時長;所述選取面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間,作為所述音頻文件的高潮部分的起點和終點包括:確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點。3.如權(quán)利要求2所述的方法,其特征在于,所述波形圖是利用波形壓縮比進行平滑處理后得到的波形圖,其中,所述波形壓縮比是指,在對所述音頻文件的波形進行平滑處理的過程中,在每個數(shù)據(jù)點的鄰域內(nèi)所選取的數(shù)據(jù)點數(shù)目;所述方法還包括:若所述差值小于所述最小時長,則調(diào)高波形壓縮比,并執(zhí)行以下步驟:a、重新根據(jù)所述音頻文件的波形圖,確定所述波形圖上振幅值大于振幅閾值的數(shù)據(jù)點,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;b、確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;c、若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點;d、若差值仍小于所述最小時長,則繼續(xù)調(diào)高波形壓縮比,重復執(zhí)行步驟a-c直至差值大于或等于所述最小時長。4.如權(quán)利要求3所述的方法,其特征在于,所述方法還包括:預先設(shè)置最大波形壓縮比;若使用的波形壓縮比大于所述最大波形壓縮比,則調(diào)低所述振幅閾值,并執(zhí)行以下步驟;e、根據(jù)音頻文件的波形圖,確定所述波形圖上大于調(diào)整后的振幅閾值的振幅值,其中,連續(xù)的數(shù)據(jù)點形成一簇數(shù)據(jù)點;f、確定每簇數(shù)據(jù)點在所述波形圖上對應的面積,確定面積最大的一簇數(shù)據(jù)點的兩端數(shù)據(jù)點對應的時間之差;g、若差值大于或等于所述最小時長,則確定所述兩端數(shù)據(jù)點對應的時間分別為所述音頻文件的高潮部分的起點和終點;h、若差值小于所述最小時長,則繼續(xù)調(diào)低所述振幅閾值,并執(zhí)行步驟e-g直至差值大于或等于所述最小時長。5.如權(quán)利要求1-4任一所述的方法,其特征在于,在所述根據(jù)音頻文件的波形圖,自動確定所述音頻文件的高潮部分的起點和終點之前,所述方法還包括:確定整個波形圖中的振幅平均值;根據(jù)所述振幅平均值,確定振幅閾...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:夏偉濤,
申請(專利權(quán))人:廣州酷狗計算機科技有限公司,
類型:發(fā)明
國別省市:廣東;44
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。