本公開涉及語音處理裝置和語音處理方法。該語音處理裝置包括:檢測單元,其被配置成檢測第一語音中包括的第一發聲部分和第二語音中包括的第二發聲部分;指定單元,其被配置成指定重疊部分,在該重疊部分之內,第一發聲部分和第二發聲部分彼此重疊;計算單元,其被配置成計算從重疊部分的起點至第一發聲部分的終點的第一發聲持續部分;以及評價單元,其被配置成至少基于與第一發聲持續部分的長度有關的信息來評價關于第一語音的印象。
【技術實現步驟摘要】
【專利摘要】本公開涉及。該語音處理裝置包括:檢測單元,其被配置成檢測第一語音中包括的第一發聲部分和第二語音中包括的第二發聲部分;指定單元,其被配置成指定重疊部分,在該重疊部分之內,第一發聲部分和第二發聲部分彼此重疊;計算單元,其被配置成計算從重疊部分的起點至第一發聲部分的終點的第一發聲持續部分;以及評價單元,其被配置成至少基于與第一發聲持續部分的長度有關的信息來評價關于第一語音的印象。【專利說明】
本文公開的實施方式例如設及語音處理裝置、語音處理方法W及存儲語音處理程 序的介質。
技術介紹
近年來,隨著信息處理裝備的發展,通過例如在便攜式終端或個人計算機中安裝 的電話呼叫應用程序來執行對話的情況在不斷增加。當人們與對方對話時,如果在他們理 解其伙伴的想法的同時他們繼續對話,那么可W實現順楊的交流。在運種情況下,為了使他 們中的每個人都充分地理解其伙伴的想法,期望他們中的每個人在不打斷伙伴的發聲的情 況下發聲。因此,需要用于評價印象的技術,W便知曉是否成功地實現順楊的交流,其中,該 印象與打斷來自輸入語音的伙伴的發聲有關。例如,公司的電話會議等,通過評價與每個員 工的發聲有關的印象,可W在組織中的交流問題的提取中使用該技術。要注意的是,例如日 本公開專利出版物第2010-175984號作為相關現有技術文件是可用的。 為了評價關于第一用戶的發聲給第二用戶的印象,使用W下技術:充當評價員的 第Ξ用戶主觀地評價第二用戶和第一用戶之間的對話。然而,如果評價需要處理時間,則應 當考慮評價的客觀性的保證等,該技術未必是優選的方法。然而,現狀是尚未實現能夠評價 關于第一用戶的發聲給第二用戶的印象的語音處理裝置。本實施方式的目的是提供一種語 音處理裝置,其能夠評價關于第一用戶的發聲給第二用戶的印象。
技術實現思路
根據實施方式的方面,一種語音處理裝置包括:檢測單元,其被配置成檢測第一用 戶的第一語音中包括的第一發聲部分和第二用戶的第二語音中包括的第二發聲部分;指定 單元,其被配置成指定重疊部分,在該重疊部分之內,第一發聲部分和第二發聲部分彼此重 疊;計算單元,其被配置成計算從重疊部分的起點至第一發聲部分的終點的第一發聲持續 部分;W及評價單元,其被配置成至少基于與第一發聲持續部分的長度有關的信息來評價 關于第一語音的印象。 使用本文公開的語音處理裝置,可W評價關于第一用戶的發聲給第二用戶的印 象。【附圖說明】 根據結合附圖的本實施方式的W下描述,運些和/或其它的方面和優點將會變得 明顯并且更加容易理解,在附圖中: 圖1是根據第一實施方式的語音處理裝置的功能框圖;[000引圖2是通過語音處理裝置的語音處理方法的流程圖; 圖3是根據一個實施方式的檢測單元的功能框圖; 圖4是圖示了通過檢測單元的第一發聲部分和第一無聲部分之內的檢測結果的視 圖; 圖5A是第一發聲持續部分的第一示意圖,而圖5B是第一發聲持續部分的第二示意 圖; 圖6是第一發聲持續部分和關于發聲的印象之間的關聯表; 圖7是根據一個實施方式起到便攜式終端設備作用的硬件框圖;W及 圖8是根據一個實施方式起到語音處理裝置作用的計算機的硬件框圖。【具體實施方式】 在下文中,描述了根據一個實施方式的語音處理裝置、語音處理方法W及其中存 儲有語音處理程序的介質的工作示例。要注意,工作示例并不對本文所公開的技術進行限 制。 (工作示例1) 圖1是根據第一實施方式的語音處理裝置的功能框圖。語音處理裝置1包括:獲取 單元2、檢測單元3、指定單元4、計算單元5和評價單元6。圖2是語音處理裝置的語音處理的 流程圖。圖2所示的語音處理裝置可W是圖1所示的語音處理裝置1。在工作示例1的描述中, 結合圖1中描繪的語音處理裝置1的功能框圖的功能描述來描述圖2中描繪的通過語音處理 裝置1的語音處理的流程。 獲取單元2例如是經由布線邏輯的硬件電路。獲取單元2可W是采用其它方式的通 過語音處理裝置1執行的由計算機程序實現的功能模塊。獲取單元2獲取第一用戶的第一語 音和第二用戶的第二語音,其中,第一語音和第二語音例如是通過外部裝置的輸入語音的 示例。要注意的是,剛才描述的過程對應于圖2中描繪的流程圖的步驟S201。在運里,第一語 音是傳輸語音,其例如指示了通過使用語音處理裝置1的第一用戶(其可W被稱為自己)向 作為第一用戶的對話伙伴的第二用戶(其可W被稱為對方)發出的語音。同時,第二語音是 第一用戶的接收語音,其指示了例如由第二用戶向第一用戶發出語音。要注意的是,傳輸語 音可W是第二用戶的第二語音,而接收語音可W是第一用戶的第一語音。獲取單元2例如被 禪接到語音處理裝置1或者在語音處理裝置1中被處理。獲取單元2可W從未被描繪的麥克 風中獲取傳輸語音(其對應于在上文描述的外部裝置)。進一步,盡管第一語音和第二語音 例如是日本語的語音,但是它們也可W是諸如英語之類的不同語言的采用其它方式的語 音。換言之,在工作示例1中的語音處理不具有語言依賴性。獲取單元2將獲取的第一語音和 第二語音輸出至檢測單元3。 檢測單元3例如是經由布線邏輯的硬件電路。檢測單元3可W是采用其它方式的通 過語音處理裝置1執行由計算機程序實施的功能模塊。檢測單元3從獲取單元2中接收第一 語音和第二語音。檢測單元3檢測第一有效期部分,其指示第一語音中包括的第一發聲部分 (其可W被稱為第一語音的部分)。進一步,檢測單元3檢測第二有效期部分,其指示第二語 音中包括的第二發聲部分(其可W被稱為第二語音的部分)。要注意的是,剛才描述的過程 對應于圖2中描繪的流程圖的步驟S202。第一有效期部分或第二有效期部分例如是W下部 分:自第一用戶或第二用戶在其發聲期間在執行吸氣之后開始發聲起,直到第一用戶或第 二用戶執行吸氣為止的部分(換言之,第一呼吸和第二呼吸之間的部分或在其之內發聲持 續的部分)。檢測單元3檢測平均信噪比(SNR),其例如是來自第一語音或第二語音中包括的 多個帖的信號質量(其可W被稱為第一信噪比或第二信噪比)的示例。因此,檢測單元3可W 檢測在其之內平均SNR滿足第一發聲部分或第二發聲部分的給定條件的部分。進一步,檢測 單元3檢測吸氣部分,其被包括在第一語音或第二語音中,并且指示了持續至第一發聲部分 或第二發聲部分的結尾的無聲部分。檢測單元3例如可W檢測W下部分:在該部分之內,上 文描述的平均SNR不滿足作為第一無聲部分或第二無聲部分(或換言之,第一吸氣部分或第 二吸氣部分)的給定條件。 在運里,詳細描述了通過檢測單元3的第一發聲部分或第二發聲部分或第一無聲 部分或第二無聲部分的檢測過程。要注意的是,可W使用第一發聲部分的檢查方法來執行 第二發聲部分的檢測方法,并且可W使用第一無聲部分的檢測方法執行第二無聲部分的檢 測方法。因此,在工作示例1的描述中,描述了通過檢測單元3的第一無聲部分和第一發聲部 分的檢測過程的細節。圖3是根據一個實施方式的檢測單元的功能框圖。圖3所示的檢測單 元可W是圖1所示的檢測單元3。檢測單元3包括音量計算單元9、噪聲估計單元10、平均SNR 計算單元11和部分確定單元12。要注意的是,檢測單元3未必包括音量計算單元9、噪聲估計 單元10、平均SNR計算單元11和部分確定單元12,而是可本文檔來自技高網...
【技術保護點】
一種語音處理裝置,包括:檢測單元,其被配置成檢測第一語音中包括的第一發聲部分和第二語音中包括的第二發聲部分;指定單元,其被配置成指定重疊部分,在所述重疊部分之內,所述第一發聲部分和所述第二發聲部分彼此重疊;計算單元,其被配置成計算從所述重疊部分的起點至所述第一發聲部分的終點的第一發聲持續部分;以及評價單元,其被配置成至少基于與所述第一發聲持續部分的長度有關的信息來評價關于所述第一語音的印象。
【技術特征摘要】
...
【專利技術屬性】
技術研發人員:外川太郎,鹽田千里,香村紗友梨,大谷猛,
申請(專利權)人:富士通株式會社,
類型:發明
國別省市:日本;JP
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。