本發明專利技術涉及信號處理裝置、信號處理方法和計算機程序。該信號處理裝置包括:頻率轉換處理單元,該頻率轉換處理單元將輸入聲音信號中的峰值信號電平超過第一閾值的一部分設置為處理對象信號,并且對該處理對象信號施加頻率轉換處理,以獲取多個帶中的各個帶的功率電平;以及振幅壓縮單元,當在由頻率轉換處理單元獲取的多個帶中的各個帶的功率電平中存在超過第二閾值的功率電平時,該振幅壓縮單元執行振幅壓縮處理,否則,禁止執行振幅壓縮處理,該振幅壓縮處理用于以處理對象信號的峰值信號電平落入在第一閾值內的壓縮率壓縮該處理對象信號的信號電平。
【技術實現步驟摘要】
本專利技術涉及信息處理裝置、信息處理方法和計算機程序,更具體地涉及適合能夠 記錄和再現更忠實于原始聲音的聲音的信息處理裝置、信息處理方法和計算機程序。
技術介紹
存在記錄從傳聲器(microphone)輸入的環境聲音的聲音記錄裝置。輸入到聲音 記錄裝置的環境聲音的振幅范圍為大約20dBSPL至130dBSPL。當聲音記錄裝置直接記錄 這種振幅信息(環境聲音的聲音信號)時,需要在聲音記錄裝置上安裝具有可適用于該振 幅范圍的動態范圍的電路。然而,這種電路的成本極高。因此,通常,采用使用AGC(自動增 益控制)電路來限制輸入聲音信號的振幅的方法(在下文中稱為振幅限制方法)。存在當 由于輸入聲音信號的波形達到該電路的動態范圍而導致該波形畸變時對畸變部分(在下 文中稱為削波部分(clip portion))的波形進行內插(interpolate)的方法(在下文中稱 為波形內插方法)(例如,參見JP-A-60-202576 (專利文獻1)和JP-A-53-30257 (專利文獻 2))。
技術實現思路
下面說明過去的振幅限制方法。應用過去的振幅限制方法的AGC電路(在下文中 簡稱為過去的AGC電路)大致被分類成反饋格式(feedback format)(在下文中稱為FB格 式)的電路和前饋格式(feed-forward format)(在下文中稱為FF格式)的電路。圖1是過去的FB格式的AGC電路的實例的視圖。圖1所示的實例的過去的FB格 式的AGC電路10包括放大器11和檢測器電路12。放大器11以預定的增益放大輸入聲音 信號,并且輸出該輸入聲音信號。被放大器11放大的聲音信號被反饋到檢測器電路12。檢 測器電路12檢測放大的聲音信號的振幅,并且基于檢測結果來改變放大器11的增益。圖2是過去的FF格式的AGC電路的實例的視圖。圖2所示的實例的過去的FF格 式的AGC電路20包括延遲電路21、檢測器電路22和放大器23。延遲電路21使輸入聲音 信號延遲預定的時間,并且將該輸入聲音信號提供到放大器23。檢測器電路22檢測輸入聲 音信號的振幅,并且基于檢測結果來改變放大器23的增益。放大器23以由檢測器電路22 改變的增益對由延遲電路21延遲并輸出的聲音信號進行放大,并且輸出該聲音信號。過去的FB格式和FF格式的AGC電路都可以在輸入聲音信號的振幅值超過閾值 時降低放大器11或23的增益,以抑制輸出聲音信號的振幅值。然而,在過去的FB格式的 AGC電路10中,在輸入聲音信號的振幅值超過閾值之后的一段時間內,以改變之前的增益 放大輸入聲音信號。因此,在輸入聲音信號的振幅值超過閾值之后改變增益以前,輸出聲音 信號的振幅值超過閾值。另一方面,在過去的FF格式的AGC電路20中,在輸入聲音信號的 振幅值超過閾值之后立即以改變后的增益放大輸入聲音信號。因此,雖然輸入聲音信號的振幅值超過閾值,但是輸出聲音信號的振幅值被限制以落入在閾值內。因此,與過去的FB格式的AGC電路10相比,在過去的FF格式的AGC電路20中提高了波形響應性(waveform responsiveness)。圖3是過去的FB格式和FF格式的AGC電路的實例的視圖。圖3的A是輸入聲音信號的包絡線的實例的視圖。圖3的B是過去的FB格式的 AGC電路10的輸出聲音信號的包絡線的實例的視圖。圖3的C是過去的FF格式的AGC電 路20的輸出聲音信號的包絡線的實例的視圖。在圖3的A中示出的實例中,在從時刻TA到時刻TB的時間段中,輸入聲音信號的 振幅值超過閾值th。在該時間段中,輸入聲音信號的波形達到了動態范圍d。如圖3的B所示,在過去的FB格式的AGC電路10中,相對于在輸入聲音信號的振 幅值超過閾值th時的時刻TA,在輸出聲音信號的振幅值被抑制以落入在閾值th內時的時 刻TC延遲了。因此,在從時刻TA到時刻TC的時間段中,輸出聲音信號的振幅值超過了閾 值th,并且輸出聲音信號的波形達到了動態范圍d。另一方面,如圖3的C所示,在過去的FF格式的AGC電路20中,在從時刻ΤΑ,至Ij 時刻ΤΒ’的時間段中,輸出聲音信號的振幅值被抑制以落入在閾值th內。這樣,由此可知, 與過去的FB格式的AGC電路10相比,在過去的FF格式的AGC電路20中提高了波形響應 性。在圖3的C中示出的實例中的時刻TA’和TB’中的每一個是從在圖3的A中示出的實 例的時刻TA和時刻TB中的每一個起經過在延遲電路21中設置的預定的延遲時間之后的 時刻。然而,不管采用過去的FB格式和FF格式的AGC電路中的哪一個,當在輸入聲音信 號的振幅值超過閾值th之后又落入到閾值th以下之后立即輸出聲音信號時,在某一種情 況中,都產生不自然的聲音。在圖3的A中示出的實例中,在輸入聲音信號的振幅值落入到閾值th以下時的時 刻是時刻TB。如圖3的B中所示,在過去的FB格式的AGC電路10中,輸出聲音信號的振幅 值在時刻TB基本上下降并然后逐漸地上升。如圖3的C中所示,在過去的FF格式的AGC 電路20中,輸出聲音信號的振幅值在時刻TB’基本上下降并然后逐漸地上升。這種現象, 艮口,振幅值基本上下降并然后逐漸地上升的現象,稱為攻擊復蘇(attack recovery)。因為 從在輸入聲音信號的振幅值越過閾值th改變時的時刻到根據振幅值的變化改變放大器的 增益為止的響應時間(在下文中稱為攻擊復蘇時間)長,所以出現攻擊復蘇。因為如果攻 擊復蘇時間短,則出現其它有害的影響,所以攻擊復蘇時間被設置得長。圖4是用于說明對于攻擊復蘇時間的輸出聲音信號的波形的實例的視圖。圖4的A是輸入聲音信號的包絡線的視圖。圖4的B是在攻擊復蘇時間長時獲得 的輸出聲音信號的包絡線的視圖。圖4的C是在攻擊復蘇時間短時獲得的輸出聲音信號的 包絡線的視圖。在攻擊復蘇時間短時,AGC電路在輸入聲音信號的振幅值越過閾值th時立 即改變放大器的增益。因此,如圖4的B中所示,輸出聲音信號的振幅是均勻化的 (imiformalized)。結果,丟失(lose) 了輸入聲音信號的包絡線信息。與這種輸出聲音信號相對應的聲音是應該原本出現的在音量方面沒有任何改變的聲音。因此,在某一種情況 中,觀看者在聽覺(audibility)方面有一種不舒服感。這是在攻擊復蘇時間短時出現的有害影響。 另一方面,在攻擊復蘇時間長時,即使輸入聲音信號的振幅值越過閾值th,也不會 立即改變放大器的增益。因此,如圖4的C中所示,保持輸入聲音信號的包絡線信息。因 此,可以形成與輸入聲音信號的形狀接近的輸出聲音信號的形狀。然而,如果攻擊復蘇時間 被設置得太長,則輸入聲音信號的振幅值小于閾值th,并且輸出聲音信號的振幅值保持小。 結果,與輸出聲音信號相對應的聲音的音量保持調低。因此,作為攻擊復蘇時間,追求和設置最佳時間。這是過去的AGC電路的復雜設計 的原因。在過去的AGC電路中,必須檢測輸入聲音信號的振幅值。振幅值的檢測也稱為電 平檢測。作為過去的電平檢測的方法,簡單地檢測輸入聲音信號的振幅值的方法(在下文 中稱為峰值檢測方法)和在時間方向上對輸入聲音信號的有效值進行積分并檢測振幅值 的方法(在下文中稱為積分檢測方法)是公知的。在應用峰值檢測方法時,過去的AGC電 路還對其振幅值瞬時本文檔來自技高網...
【技術保護點】
一種信號處理裝置,包括:頻率轉換處理單元,該頻率轉換處理單元將輸入聲音信號中的峰值信號電平超過第一閾值的一部分設置為處理對象信號,并且對該處理對象信號施加頻率轉換處理,以獲取多個帶中的各個帶的功率電平;以及振幅壓縮單元,當在由頻率轉換處理單元獲取的多個帶中的各個帶的功率電平中存在超過第二閾值的功率電平時,該振幅壓縮單元執行振幅壓縮處理,否則,禁止執行振幅壓縮處理,該振幅壓縮處理用于以處理對象信號的峰值信號電平落入在第一閾值內的壓縮率壓縮該處理對象信號的信號電平。
【技術特征摘要】
...
【專利技術屬性】
技術研發人員:細見宙史,
申請(專利權)人:索尼公司,
類型:發明
國別省市:JP[日本]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。