• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    自動音源相似度比對方法及裝置制造方法及圖紙

    技術(shù)編號:3046183 閱讀:241 留言:0更新日期:2012-04-11 18:40
    本發(fā)明專利技術(shù)是有關(guān)于一種自動音源評分方法及裝置,用以評量一段待測音源所具有的音源分?jǐn)?shù),由于待測音源是根據(jù)一預(yù)設(shè)音框長度而劃分為復(fù)數(shù)個待測頻帶,因此評分裝置是于一一計(jì)算出各待測頻帶的音源分?jǐn)?shù)后,再累計(jì)所有音源分?jǐn)?shù)加以平均,進(jìn)而取得整段待測音源的音源分?jǐn)?shù)。本發(fā)明專利技術(shù)首先是擷取其中一待測頻帶,并將其與對應(yīng)基準(zhǔn)頻帶的前后鄰近時間軸上的頻帶相比較,以選定一具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶,使得本發(fā)明專利技術(shù)可由考量待測音源所具有的些微時間差的因素、而提高音源評分的合理性。(*該技術(shù)在2024年保護(hù)過期,可自由使用*)

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)是關(guān)于一種評分方法及裝置,尤指一種自動音源評分方法及裝置,其適用范圍包括應(yīng)用于語音評分系統(tǒng)、或影音伴唱系統(tǒng)等
    中。
    技術(shù)介紹
    于一般音源評分系統(tǒng)中,例如影音歌唱評分系統(tǒng),主要是將擷取到的音源與預(yù)存的音源相比較,以計(jì)算出前者的音源分?jǐn)?shù)。已知通常是使用音高(pitch)以根據(jù)音源的頻率變化來比對計(jì)算出音源分?jǐn)?shù)。然而,以音高為基礎(chǔ)來計(jì)算音源分?jǐn)?shù)的運(yùn)算過程較復(fù)雜、且計(jì)算量較高;此外,由于音高是由音源的波形所估算出來,因此雖然母音可穩(wěn)定呈現(xiàn),但子音部分卻極易受到摩擦音、或氣音的影響而呈現(xiàn)不穩(wěn)定波形,致使音高被誤判,并非十分理想。已知亦提出利用語音能量(energy)來計(jì)算音源分?jǐn)?shù)的方法,以由判斷音源能量的起伏,來比對其與預(yù)設(shè)音源(或基準(zhǔn)音源)能量的能量變化趨勢,進(jìn)而計(jì)算出音源分?jǐn)?shù)。例如已知是利用濾波器組(filter bank)來過濾音源,并分別輸出代表不同頻率的能量,再將每一個頻帶的頻率一一與預(yù)設(shè)能量進(jìn)行比較而計(jì)算出分?jǐn)?shù);又如美國專利公告第6326536號專利文獻(xiàn)是提出將音源先利用低通濾波器(low pass filter,LPS)將高頻能量濾除、留下低頻能量,再使用等級偵測器(level detector)判斷各頻帶的低頻能量是否超過一預(yù)設(shè)等級,若超過則將此頻帶定義為“1”、否則將此頻帶定義為“0”,因而形成一串脈沖序列(impulsesequence),據(jù)以與預(yù)設(shè)音源的脈沖序列比對。由于每人音色不同,且一般人所發(fā)出的音源無法與機(jī)器比擬,以歌唱評分為例,即使演唱者的唱腔、音色、節(jié)拍皆與原唱神似,卻仍舊無法百分的百符合預(yù)設(shè)音源的能量波形。然而,已知的音源評分裝置皆不具備容忍時間差的設(shè)計(jì),亦即演唱者的音源頻帶僅能與固定對應(yīng)的頻帶相比來計(jì)算出分?jǐn)?shù),倘若演唱者唱得和原唱極為相似,但確有些微時間差,則最后計(jì)算出的分?jǐn)?shù)將大打折扣,此評分方法過于嚴(yán)格且不甚合理。由此可知,已知音源評分裝置并不具備時間差容忍特性,而有予以改進(jìn)的必要。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的主要目的是在提供一種自動音源評分方法及裝置,是允許待測音源頻帶與基準(zhǔn)音源頻帶的前后鄰近時間軸上的頻帶相比較,以便將待測音源與基準(zhǔn)音源問的時間差并入考量的目的,以提高音源評分的合理性。本專利技術(shù)的另一目的是在提供一種自動音源評分方法及裝置,是使用以對數(shù)能量(log energy)為基礎(chǔ)所衍生的參數(shù)作為特征參數(shù),以便能降低計(jì)算量,并具有高可靠度。依據(jù)本專利技術(shù)的一特色,是提出一種自動音源評分方法,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該方法包括下列步驟(A)自該待測音源中擷取出第n個待測頻帶Yn;(B)將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Yn的音源分?jǐn)?shù)。其中,于步驟(B)前,尚包括一步驟(D),用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。其中,若n-m大于等于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,若n-m小于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,于步驟(C)后,尚包括一步驟(E),是用以判斷是否具有后續(xù)待測頻帶,若是則繼續(xù)執(zhí)行步驟(A),直到全部待測頻帶皆已計(jì)算出音源分?jǐn)?shù)為止。其中,該待測音源是為脈沖碼調(diào)變信號。其是由比對該待測頻帶Yn與該等基準(zhǔn)頻帶X的能量值所形成的特征參數(shù)以計(jì)算出該音源分?jǐn)?shù)。其中,該能量值所形成的特征參數(shù)是選自下列至少其中之一一對數(shù)能量值、一一階微分對數(shù)能量值、及一二階微分對數(shù)能量值。其中,該待測頻帶Yn的音源分?jǐn)?shù)為音源分?jǐn)?shù)=ABS(x0-y0)×α+ABS(X1-y1)×β+ABS(x2-y2)×γ’當(dāng)中,ABS為絕對值函數(shù),x0及y0為對數(shù)能量值,x1及y1為一階微分對數(shù)能量值,x2及y2為二階微分對數(shù)能量值,α、β、及γ是分別為一權(quán)重值。其是即時自音源擷取裝置中持續(xù)擷取出該待測音源及其待測頻帶,以便即時對該等待測頻帶評分。其中,若n-a小于或等于零,則自第1個基準(zhǔn)頻帶X1起比對。其中,若n+b大于K,則最多比對至第K個基準(zhǔn)頻帶XK。依據(jù)本專利技術(shù)的另一特色,所提出的一種自動音源評分裝置,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該裝置包括一接收單元,是接收一段待測音源;一模擬數(shù)字轉(zhuǎn)換單元,用以將該待測音源由模擬信號轉(zhuǎn)換為數(shù)字信號;一存儲器,是儲存至少一段基準(zhǔn)音源,并用以暫存所接收的該待測音源;一特征參數(shù)抽取單元,是擷取出該待測音源的待測頻帶的特征參數(shù)、及該基準(zhǔn)音源的基準(zhǔn)頻帶的特征參數(shù);一評分單元,是自該待測音源中擷取出第n個待測頻帶Yn,并將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,以計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及一顯示單元,用以顯示該音源分?jǐn)?shù)。其中,該評分裝置是用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。其中,該評分裝置若比對出n-m大于等于a,則是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,該評分裝置若n-m小于a,則是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,該顯示單元是于每間隔一預(yù)設(shè)期間后、顯示該預(yù)設(shè)期間內(nèi)的平均音源分?jǐn)?shù),并于該待測音源結(jié)束后,顯示一累計(jì)平均音源分?jǐn)?shù)。其中,該顯示單元是于每間隔一預(yù)設(shè)期間后、顯示一累計(jì)平均音源分?jǐn)?shù)。其中,該模擬數(shù)字轉(zhuǎn)換單元是將該待測音源由模擬信號轉(zhuǎn)換為脈沖碼調(diào)變數(shù)字信號。其中,若n-a小于或等于零,則自第1個基準(zhǔn)頻帶X1起比對。其中,若n+b大于K,則最多比對至第K個基準(zhǔn)頻帶XK。附圖說明為能讓審查員能更了解本專利技術(shù)的
    技術(shù)實(shí)現(xiàn)思路
    ,特舉二較佳具體實(shí)施例說明如下,其中圖1是本專利技術(shù)一較佳實(shí)施例的功能方塊圖。圖2是本專利技術(shù)一較佳實(shí)施例的流程圖。圖3是本專利技術(shù)另一較佳實(shí)施例的流程圖。具體實(shí)施例方式請先參閱圖1本實(shí)施例自動音源評分裝置1的功能方塊圖,其是為一歌唱評分裝置,以對使用者所演唱的曲目評分,例如卡拉OK(karaoke)評分裝置,當(dāng)然亦可以是語音評分裝置、或其他等效的音源評分裝置。如圖1所示,評分裝置1包括有一接收單元11、一模擬數(shù)字轉(zhuǎn)換單元12(analog to digital converter)、一存儲器13、一特征參數(shù)抽取單元14、一評分單元15、以及一顯示單元16。接收單元11較佳為一麥克風(fēng),用以接收使用者(或演唱者)演唱歌曲所傳來的待測音源;存儲器13是儲存至少一段基準(zhǔn)音源,例如為伴唱帶或碟片中主唱的音調(diào)、或歌曲原唱者的旋律等,且本實(shí)施例的存儲器13并具有暫存功能;顯示單元1本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    一種自動音源評分方法,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該方法包括下列步驟:(A)自該待測音源中擷取出第n個待測頻帶Y↓[n];(B)將該待測頻帶Y↓[n]逐 一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Y↓[n]對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Y↓[n]的音源分?jǐn)?shù)。

    【技術(shù)特征摘要】
    1.一種自動音源評分方法,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該方法包括下列步驟(A)自該待測音源中擷取出第n個待測頻帶Yn;(B)將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Yn的音源分?jǐn)?shù)。2.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其中,于步驟(B)前,尚包括一步驟(D),用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。3.如權(quán)利要求2所述的自動音源評分方法,其特征在于,其中,若n-m大于等于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。4.如權(quán)利要求2所述的自動音源評分方法,其特征在于,其中,若n-m小于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。5.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其中,于步驟(C)后,尚包括一步驟(E),是用以判斷是否具有后續(xù)待測頻帶,若是則繼續(xù)執(zhí)行步驟(A),直到全部待測頻帶皆已計(jì)算出音源分?jǐn)?shù)為止。6.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其中,該待測音源是為脈沖碼調(diào)變信號。7.如權(quán)利要求6所述的自動音源評分方法,其特征在于,其是由比對該待測頻帶Yn與該等基準(zhǔn)頻帶X的能量值所形成的特征參數(shù)以計(jì)算出該音源分?jǐn)?shù)。8.如權(quán)利要求7所述的自動音源評分方法,其特征在于,其中,該能量值所形成的特征參數(shù)是選自下列至少其中之一一對數(shù)能量值、一一階微分對數(shù)能量值、及一二階微分對數(shù)能量值。9.如權(quán)利要求7所述的自動音源評分方法,其特征在于,其中,該待測頻帶Yn的音源分?jǐn)?shù)為音源分?jǐn)?shù)=ABS(x0-y0)×α+ABS(x1-y1)×β+ABS(x2-y2)×γ’當(dāng)中,ABS為絕對值函數(shù),x0及y0為對數(shù)能量值,x1及y1為一階微分對數(shù)能量值,x2及y2為二階微分對數(shù)能量值,α、β、及γ是分別為一權(quán)重值。10.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其是即時自音源擷取裝置中持續(xù)擷取出該待測音源及其待測頻帶,以便即時對該等待測頻帶評分。11.如權(quán)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:張弘杰
    申請(專利權(quán))人:凌陽科技股份有限公司
    類型:發(fā)明
    國別省市:71[中國|臺灣]

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    相關(guān)領(lǐng)域技術(shù)
    • 暫無相關(guān)專利
    主站蜘蛛池模板: 亚洲AV永久无码精品成人| 精品无码国产自产拍在线观看| 亚洲av无码国产综合专区 | 少妇无码?V无码专区在线观看| 无码少妇一区二区浪潮av| 亚洲精品无码AV人在线播放| 亚洲AV无码成人专区| gogo少妇无码肉肉视频| 无码国内精品人妻少妇蜜桃视频| 亚洲av中文无码字幕色不卡| 在线播放无码后入内射少妇| 色欲AV永久无码精品无码| 伊人久久精品无码av一区| 麻豆亚洲AV成人无码久久精品| 中文精品无码中文字幕无码专区 | 亚洲成AV人片在线播放无码 | 无遮掩无码h成人av动漫| 国产成人无码18禁午夜福利p| 人妻无码久久精品人妻| 欧洲精品久久久av无码电影| 免费无码黄网站在线看| 性色av极品无码专区亚洲| 未满十八18禁止免费无码网站| 激情无码人妻又粗又大| 无码日韩精品一区二区免费| 亚洲Av无码专区国产乱码DVD| 久青草无码视频在线观看 | 精品无码国产一区二区三区麻豆 | 久久无码国产专区精品| 国产AV无码专区亚洲AVJULIA| 国产午夜无码视频免费网站| 无码尹人久久相蕉无码| 亚洲日韩av无码中文| 2024你懂的网站无码内射| 无码国内精品久久人妻| 无码一区二区三区| 日韩精品无码熟人妻视频| 人妻丰满av无码中文字幕| 无码人妻视频一区二区三区| 亚洲AV永久无码精品| 色窝窝无码一区二区三区色欲|