自動音源相似度比對方法及裝置制造方法及圖紙

技術(shù)編號：3046183 閱讀：241 留言：0更新日期：2012-04-11 18:40

本發(fā)明專利技術(shù)是有關(guān)于一種自動音源評分方法及裝置，用以評量一段待測音源所具有的音源分?jǐn)?shù)，由于待測音源是根據(jù)一預(yù)設(shè)音框長度而劃分為復(fù)數(shù)個待測頻帶，因此評分裝置是于一一計(jì)算出各待測頻帶的音源分?jǐn)?shù)后，再累計(jì)所有音源分?jǐn)?shù)加以平均，進(jìn)而取得整段待測音源的音源分?jǐn)?shù)。本發(fā)明專利技術(shù)首先是擷取其中一待測頻帶，并將其與對應(yīng)基準(zhǔn)頻帶的前后鄰近時間軸上的頻帶相比較，以選定一具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶，使得本發(fā)明專利技術(shù)可由考量待測音源所具有的些微時間差的因素、而提高音源評分的合理性。（*該技術(shù)在2024年保護(hù)過期，可自由使用*）

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

本專利技術(shù)是關(guān)于一種評分方法及裝置，尤指一種自動音源評分方法及裝置，其適用范圍包括應(yīng)用于語音評分系統(tǒng)、或影音伴唱系統(tǒng)等
中。
技術(shù)介紹
于一般音源評分系統(tǒng)中，例如影音歌唱評分系統(tǒng)，主要是將擷取到的音源與預(yù)存的音源相比較，以計(jì)算出前者的音源分?jǐn)?shù)。已知通常是使用音高(pitch)以根據(jù)音源的頻率變化來比對計(jì)算出音源分?jǐn)?shù)。然而，以音高為基礎(chǔ)來計(jì)算音源分?jǐn)?shù)的運(yùn)算過程較復(fù)雜、且計(jì)算量較高；此外，由于音高是由音源的波形所估算出來，因此雖然母音可穩(wěn)定呈現(xiàn)，但子音部分卻極易受到摩擦音、或氣音的影響而呈現(xiàn)不穩(wěn)定波形，致使音高被誤判，并非十分理想。已知亦提出利用語音能量(energy)來計(jì)算音源分?jǐn)?shù)的方法，以由判斷音源能量的起伏，來比對其與預(yù)設(shè)音源(或基準(zhǔn)音源)能量的能量變化趨勢，進(jìn)而計(jì)算出音源分?jǐn)?shù)。例如已知是利用濾波器組(filter bank)來過濾音源，并分別輸出代表不同頻率的能量，再將每一個頻帶的頻率一一與預(yù)設(shè)能量進(jìn)行比較而計(jì)算出分?jǐn)?shù)；又如美國專利公告第6326536號專利文獻(xiàn)是提出將音源先利用低通濾波器(low pass filter，LPS)將高頻能量濾除、留下低頻能量，再使用等級偵測器(level detector)判斷各頻帶的低頻能量是否超過一預(yù)設(shè)等級，若超過則將此頻帶定義為“1”、否則將此頻帶定義為“0”，因而形成一串脈沖序列(impulsesequence)，據(jù)以與預(yù)設(shè)音源的脈沖序列比對。由于每人音色不同，且一般人所發(fā)出的音源無法與機(jī)器比擬，以歌唱評分為例，即使演唱者的唱腔、音色、節(jié)拍皆與原唱神似，卻仍舊無法百分的百符合預(yù)設(shè)音源的能量波形。然而，...

【技術(shù)保護(hù)點(diǎn)】
一種自動音源評分方法，用以評量一段待測音源所具有的音源分?jǐn)?shù)，該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為Ｋ個待測頻帶，其特征在于，該方法包括下列步驟：（Ａ）自該待測音源中擷取出第ｎ個待測頻帶Ｙ↓［ｎ］；（Ｂ）將該待測頻帶Ｙ↓［ｎ］逐一與一段基準(zhǔn)音源中的第ｎ－ａ個至第ｎ＋ｂ個基準(zhǔn)頻帶Ｘ比對，并計(jì)算出該待測頻帶Ｙ↓［ｎ］對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)；以及（Ｃ）將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Ｘ’所具有的音源分?jǐn)?shù)評定為該待測頻帶Ｙ↓［ｎ］的音源分?jǐn)?shù)。

【技術(shù)特征摘要】
1.一種自動音源評分方法，用以評量一段待測音源所具有的音源分?jǐn)?shù)，該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶，其特征在于，該方法包括下列步驟(A)自該待測音源中擷取出第n個待測頻帶Yn；(B)將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對，并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)；以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Yn的音源分?jǐn)?shù)。2.如權(quán)利要求1所述的自動音源評分方法，其特征在于，其中，于步驟(B)前，尚包括一步驟(D)，用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。3.如權(quán)利要求2所述的自動音源評分方法，其特征在于，其中，若n-m大于等于a，則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對，并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。4.如權(quán)利要求2所述的自動音源評分方法，其特征在于，其中，若n-m小于a，則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對，并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。5.如權(quán)利要求1所述的自動音源評分方法，其特征在于，其中，于步驟(C)后，尚包括一步驟(E)，是用以判斷是否具有后續(xù)待測頻帶，若是則繼續(xù)執(zhí)行步驟(A)，直到全部待測頻帶皆已計(jì)算出音源分?jǐn)?shù)為止。6.如權(quán)利要求1所述的自動音源評分方法，其特征在于，其中，該待測音源是為脈沖碼調(diào)變信號。7.如權(quán)利要求6所述的自動音源評分方法，其特征在于，其是由比對該待測頻帶Yn與該等基準(zhǔn)頻帶X的能量值所形成的特征參數(shù)以計(jì)算出該音源分?jǐn)?shù)。8.如權(quán)利要求7所述的自動音源評分方法，其特征在于，其中，該能量值所形成的特征參數(shù)是選自下列至少其中之一一對數(shù)能量值、一一階微分對數(shù)能量值、及一二階微分對數(shù)能量值。9.如權(quán)利要求7所述的自動音源評分方法，其特征在于，其中，該待測頻帶Yn的音源分?jǐn)?shù)為音源分?jǐn)?shù)＝ABS(x0-y0)×α+ABS(x1-y1)×β+ABS(x2-y2)×γ’當(dāng)中，ABS為絕對值函數(shù)，x0及y0為對數(shù)能量值，x1及y1為一階微分對數(shù)能量值，x2及y2為二階微分對數(shù)能量值，α、β、及γ是分別為一權(quán)重值。10.如權(quán)利要求1所述的自動音源評分方法，其特征在于，其是即時自音源擷取裝置中持續(xù)擷取出該待測音源及其待測頻帶，以便即時對該等待測頻帶評分。11.如權(quán)...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：張弘杰，
申請(專利權(quán))人：凌陽科技股份有限公司，
類型：發(fā)明
國別省市：71[中國|臺灣]

全部詳細(xì)技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)

暫無相關(guān)專利

人臉相似度比對算法技術(shù)

序列相似性比對技術(shù)

序列相似性比對軟件技術(shù)