本發(fā)明專利技術(shù)是有關(guān)于一種自動音源評分方法及裝置,用以評量一段待測音源所具有的音源分?jǐn)?shù),由于待測音源是根據(jù)一預(yù)設(shè)音框長度而劃分為復(fù)數(shù)個待測頻帶,因此評分裝置是于一一計(jì)算出各待測頻帶的音源分?jǐn)?shù)后,再累計(jì)所有音源分?jǐn)?shù)加以平均,進(jìn)而取得整段待測音源的音源分?jǐn)?shù)。本發(fā)明專利技術(shù)首先是擷取其中一待測頻帶,并將其與對應(yīng)基準(zhǔn)頻帶的前后鄰近時間軸上的頻帶相比較,以選定一具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶,使得本發(fā)明專利技術(shù)可由考量待測音源所具有的些微時間差的因素、而提高音源評分的合理性。(*該技術(shù)在2024年保護(hù)過期,可自由使用*)
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)是關(guān)于一種評分方法及裝置,尤指一種自動音源評分方法及裝置,其適用范圍包括應(yīng)用于語音評分系統(tǒng)、或影音伴唱系統(tǒng)等
中。
技術(shù)介紹
于一般音源評分系統(tǒng)中,例如影音歌唱評分系統(tǒng),主要是將擷取到的音源與預(yù)存的音源相比較,以計(jì)算出前者的音源分?jǐn)?shù)。已知通常是使用音高(pitch)以根據(jù)音源的頻率變化來比對計(jì)算出音源分?jǐn)?shù)。然而,以音高為基礎(chǔ)來計(jì)算音源分?jǐn)?shù)的運(yùn)算過程較復(fù)雜、且計(jì)算量較高;此外,由于音高是由音源的波形所估算出來,因此雖然母音可穩(wěn)定呈現(xiàn),但子音部分卻極易受到摩擦音、或氣音的影響而呈現(xiàn)不穩(wěn)定波形,致使音高被誤判,并非十分理想。已知亦提出利用語音能量(energy)來計(jì)算音源分?jǐn)?shù)的方法,以由判斷音源能量的起伏,來比對其與預(yù)設(shè)音源(或基準(zhǔn)音源)能量的能量變化趨勢,進(jìn)而計(jì)算出音源分?jǐn)?shù)。例如已知是利用濾波器組(filter bank)來過濾音源,并分別輸出代表不同頻率的能量,再將每一個頻帶的頻率一一與預(yù)設(shè)能量進(jìn)行比較而計(jì)算出分?jǐn)?shù);又如美國專利公告第6326536號專利文獻(xiàn)是提出將音源先利用低通濾波器(low pass filter,LPS)將高頻能量濾除、留下低頻能量,再使用等級偵測器(level detector)判斷各頻帶的低頻能量是否超過一預(yù)設(shè)等級,若超過則將此頻帶定義為“1”、否則將此頻帶定義為“0”,因而形成一串脈沖序列(impulsesequence),據(jù)以與預(yù)設(shè)音源的脈沖序列比對。由于每人音色不同,且一般人所發(fā)出的音源無法與機(jī)器比擬,以歌唱評分為例,即使演唱者的唱腔、音色、節(jié)拍皆與原唱神似,卻仍舊無法百分的百符合預(yù)設(shè)音源的能量波形。然而,已知的音源評分裝置皆不具備容忍時間差的設(shè)計(jì),亦即演唱者的音源頻帶僅能與固定對應(yīng)的頻帶相比來計(jì)算出分?jǐn)?shù),倘若演唱者唱得和原唱極為相似,但確有些微時間差,則最后計(jì)算出的分?jǐn)?shù)將大打折扣,此評分方法過于嚴(yán)格且不甚合理。由此可知,已知音源評分裝置并不具備時間差容忍特性,而有予以改進(jìn)的必要。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)的主要目的是在提供一種自動音源評分方法及裝置,是允許待測音源頻帶與基準(zhǔn)音源頻帶的前后鄰近時間軸上的頻帶相比較,以便將待測音源與基準(zhǔn)音源問的時間差并入考量的目的,以提高音源評分的合理性。本專利技術(shù)的另一目的是在提供一種自動音源評分方法及裝置,是使用以對數(shù)能量(log energy)為基礎(chǔ)所衍生的參數(shù)作為特征參數(shù),以便能降低計(jì)算量,并具有高可靠度。依據(jù)本專利技術(shù)的一特色,是提出一種自動音源評分方法,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該方法包括下列步驟(A)自該待測音源中擷取出第n個待測頻帶Yn;(B)將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Yn的音源分?jǐn)?shù)。其中,于步驟(B)前,尚包括一步驟(D),用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。其中,若n-m大于等于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,若n-m小于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,于步驟(C)后,尚包括一步驟(E),是用以判斷是否具有后續(xù)待測頻帶,若是則繼續(xù)執(zhí)行步驟(A),直到全部待測頻帶皆已計(jì)算出音源分?jǐn)?shù)為止。其中,該待測音源是為脈沖碼調(diào)變信號。其是由比對該待測頻帶Yn與該等基準(zhǔn)頻帶X的能量值所形成的特征參數(shù)以計(jì)算出該音源分?jǐn)?shù)。其中,該能量值所形成的特征參數(shù)是選自下列至少其中之一一對數(shù)能量值、一一階微分對數(shù)能量值、及一二階微分對數(shù)能量值。其中,該待測頻帶Yn的音源分?jǐn)?shù)為音源分?jǐn)?shù)=ABS(x0-y0)×α+ABS(X1-y1)×β+ABS(x2-y2)×γ’當(dāng)中,ABS為絕對值函數(shù),x0及y0為對數(shù)能量值,x1及y1為一階微分對數(shù)能量值,x2及y2為二階微分對數(shù)能量值,α、β、及γ是分別為一權(quán)重值。其是即時自音源擷取裝置中持續(xù)擷取出該待測音源及其待測頻帶,以便即時對該等待測頻帶評分。其中,若n-a小于或等于零,則自第1個基準(zhǔn)頻帶X1起比對。其中,若n+b大于K,則最多比對至第K個基準(zhǔn)頻帶XK。依據(jù)本專利技術(shù)的另一特色,所提出的一種自動音源評分裝置,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該裝置包括一接收單元,是接收一段待測音源;一模擬數(shù)字轉(zhuǎn)換單元,用以將該待測音源由模擬信號轉(zhuǎn)換為數(shù)字信號;一存儲器,是儲存至少一段基準(zhǔn)音源,并用以暫存所接收的該待測音源;一特征參數(shù)抽取單元,是擷取出該待測音源的待測頻帶的特征參數(shù)、及該基準(zhǔn)音源的基準(zhǔn)頻帶的特征參數(shù);一評分單元,是自該待測音源中擷取出第n個待測頻帶Yn,并將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,以計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及一顯示單元,用以顯示該音源分?jǐn)?shù)。其中,該評分裝置是用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。其中,該評分裝置若比對出n-m大于等于a,則是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,該評分裝置若n-m小于a,則是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。其中,該顯示單元是于每間隔一預(yù)設(shè)期間后、顯示該預(yù)設(shè)期間內(nèi)的平均音源分?jǐn)?shù),并于該待測音源結(jié)束后,顯示一累計(jì)平均音源分?jǐn)?shù)。其中,該顯示單元是于每間隔一預(yù)設(shè)期間后、顯示一累計(jì)平均音源分?jǐn)?shù)。其中,該模擬數(shù)字轉(zhuǎn)換單元是將該待測音源由模擬信號轉(zhuǎn)換為脈沖碼調(diào)變數(shù)字信號。其中,若n-a小于或等于零,則自第1個基準(zhǔn)頻帶X1起比對。其中,若n+b大于K,則最多比對至第K個基準(zhǔn)頻帶XK。附圖說明為能讓審查員能更了解本專利技術(shù)的
技術(shù)實(shí)現(xiàn)思路
,特舉二較佳具體實(shí)施例說明如下,其中圖1是本專利技術(shù)一較佳實(shí)施例的功能方塊圖。圖2是本專利技術(shù)一較佳實(shí)施例的流程圖。圖3是本專利技術(shù)另一較佳實(shí)施例的流程圖。具體實(shí)施例方式請先參閱圖1本實(shí)施例自動音源評分裝置1的功能方塊圖,其是為一歌唱評分裝置,以對使用者所演唱的曲目評分,例如卡拉OK(karaoke)評分裝置,當(dāng)然亦可以是語音評分裝置、或其他等效的音源評分裝置。如圖1所示,評分裝置1包括有一接收單元11、一模擬數(shù)字轉(zhuǎn)換單元12(analog to digital converter)、一存儲器13、一特征參數(shù)抽取單元14、一評分單元15、以及一顯示單元16。接收單元11較佳為一麥克風(fēng),用以接收使用者(或演唱者)演唱歌曲所傳來的待測音源;存儲器13是儲存至少一段基準(zhǔn)音源,例如為伴唱帶或碟片中主唱的音調(diào)、或歌曲原唱者的旋律等,且本實(shí)施例的存儲器13并具有暫存功能;顯示單元1本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種自動音源評分方法,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該方法包括下列步驟:(A)自該待測音源中擷取出第n個待測頻帶Y↓[n];(B)將該待測頻帶Y↓[n]逐 一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Y↓[n]對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Y↓[n]的音源分?jǐn)?shù)。
【技術(shù)特征摘要】
1.一種自動音源評分方法,用以評量一段待測音源所具有的音源分?jǐn)?shù),該待測音源是根據(jù)一預(yù)設(shè)音框長度劃分為K個待測頻帶,其特征在于,該方法包括下列步驟(A)自該待測音源中擷取出第n個待測頻帶Yn;(B)將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù);以及(C)將具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶X’所具有的音源分?jǐn)?shù)評定為該待測頻帶Yn的音源分?jǐn)?shù)。2.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其中,于步驟(B)前,尚包括一步驟(D),用以找出第n-1個待測頻帶Yn-1所對應(yīng)具有最佳音源分?jǐn)?shù)的基準(zhǔn)頻帶Xm。3.如權(quán)利要求2所述的自動音源評分方法,其特征在于,其中,若n-m大于等于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第n-a個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。4.如權(quán)利要求2所述的自動音源評分方法,其特征在于,其中,若n-m小于a,則步驟(B)是將該待測頻帶Yn逐一與一段基準(zhǔn)音源中的第m個至第n+b個基準(zhǔn)頻帶X比對,并計(jì)算出該待測頻帶Yn對應(yīng)于該等基準(zhǔn)頻帶所具有的音源分?jǐn)?shù)。5.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其中,于步驟(C)后,尚包括一步驟(E),是用以判斷是否具有后續(xù)待測頻帶,若是則繼續(xù)執(zhí)行步驟(A),直到全部待測頻帶皆已計(jì)算出音源分?jǐn)?shù)為止。6.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其中,該待測音源是為脈沖碼調(diào)變信號。7.如權(quán)利要求6所述的自動音源評分方法,其特征在于,其是由比對該待測頻帶Yn與該等基準(zhǔn)頻帶X的能量值所形成的特征參數(shù)以計(jì)算出該音源分?jǐn)?shù)。8.如權(quán)利要求7所述的自動音源評分方法,其特征在于,其中,該能量值所形成的特征參數(shù)是選自下列至少其中之一一對數(shù)能量值、一一階微分對數(shù)能量值、及一二階微分對數(shù)能量值。9.如權(quán)利要求7所述的自動音源評分方法,其特征在于,其中,該待測頻帶Yn的音源分?jǐn)?shù)為音源分?jǐn)?shù)=ABS(x0-y0)×α+ABS(x1-y1)×β+ABS(x2-y2)×γ’當(dāng)中,ABS為絕對值函數(shù),x0及y0為對數(shù)能量值,x1及y1為一階微分對數(shù)能量值,x2及y2為二階微分對數(shù)能量值,α、β、及γ是分別為一權(quán)重值。10.如權(quán)利要求1所述的自動音源評分方法,其特征在于,其是即時自音源擷取裝置中持續(xù)擷取出該待測音源及其待測頻帶,以便即時對該等待測頻帶評分。11.如權(quán)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張弘杰,
申請(專利權(quán))人:凌陽科技股份有限公司,
類型:發(fā)明
國別省市:71[中國|臺灣]
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。