一種語音識別/響應系統(tǒng),包括: 發(fā)言識別單元(10),通過用戶的語音輸入識別用戶的發(fā)言內(nèi)容,并且輸出識別結果; 對話控制處理單元(40),根據(jù)所述識別結果控制同用戶的對話進程,以便確定針對所述用戶的響應內(nèi)容; 發(fā)言特征分析單元(20),分析所述用戶的發(fā)言特征以便產(chǎn)生發(fā)言特征信息;和 響應語音產(chǎn)生單元(30),根據(jù)所述響應內(nèi)容和所述發(fā)言特征信息產(chǎn)生針對所述用戶的響應語音。(*該技術在2023年保護過期,可自由使用*)
【技術實現(xiàn)步驟摘要】
本專利技術涉及一種語音識別/響應系統(tǒng),提供針對用戶發(fā)言的語音響應。
技術介紹
眾所周知,語音識別/響應系統(tǒng)和語音交互系統(tǒng)都針對用戶的發(fā)言做出語音響應。針對這種系統(tǒng),已經(jīng)提出了一些實現(xiàn)特殊的語音響應例如方言的系統(tǒng)。然而,它們幾乎都有效地使用能夠從對話系統(tǒng)獲得的信息,而不使用來自用戶的發(fā)言信息。以汽車導航為例來說,與上述系統(tǒng)相對應的系統(tǒng)恰當有效地使用了汽車導航裝置發(fā)揮作用所依據(jù)的信息,例如,在汽車駕駛期間還有在語音響應中獲得的地區(qū)信息(參見日本公開專利申請2001-227962和日本公開專利申請H8-124092)。具有這種功能的系統(tǒng)給用戶帶來如下優(yōu)點使他/她能夠在聽覺上獲得他/她駕駛車輛所在地區(qū)的地區(qū)信息,這樣可以使駕駛員與/或乘客(們)感到愉快。然而,如上所述的語音識別/響應系統(tǒng)有可能產(chǎn)生這樣的問題,例如它很難實現(xiàn)用戶感覺熟悉的語音響應。更具體地說,由于各種環(huán)境與/或用戶的精神狀態(tài)的不同,用戶的發(fā)言環(huán)境和發(fā)言內(nèi)容可以有顯著的改變,因此,即沒有提出過任何一種系統(tǒng)可以應用于如汽車導航裝置的電子設備,也沒有提出任何一種方法,包括上述提及的公開文本所披露的系統(tǒng),可以完全地處理針對非特定用戶的靈活的響應。
技術實現(xiàn)思路
本專利技術,鑒于以上問題,目的在于,提供一種語音識別/響應系統(tǒng),該系統(tǒng)可以實現(xiàn)用戶感覺熟悉的語音響應。為了獲得上述目的,本專利技術的第一個方面的語音識別/響應系統(tǒng)包括發(fā)言識別單元,通過用戶的語音輸入識別用戶的發(fā)言內(nèi)容,并輸出識別結果; 對話控制處理單元,根據(jù)所述識別結果控制與用戶的對話進程,以便確定針對所述用戶的響應內(nèi)容;發(fā)言特征分析單元,分析所述用戶的發(fā)言特征,產(chǎn)生發(fā)言特征信息;和響應語音產(chǎn)生單元,根據(jù)所述響應內(nèi)容和所述發(fā)言特征信息產(chǎn)生針對所述用戶的響應語音。為了獲得上述目的,本專利技術的第二方面的存儲介質(zhì),在其上存儲由計算機執(zhí)行的語音識別/響應程序,其特征在于,所述程序導致所述計算機起到如下單元的作用發(fā)言識別單元,通過用戶的語音輸入識別用戶的發(fā)言內(nèi)容,并輸出識別結果;對話控制處理單元,根據(jù)所述識別結果控制與用戶的對話進程,以便確定針對所述用戶的響應內(nèi)容;發(fā)言特征分析單元,分析所述用戶的發(fā)言特征,產(chǎn)生發(fā)言特征信息;和響應語音產(chǎn)生單元,根據(jù)所述響應內(nèi)容和所述發(fā)言特征信息產(chǎn)生針對所述用戶的響應語音。為了獲得上述目的,本專利技術的第三方面的語音識別/響應程序,所述程序由計算機執(zhí)行,其特征在于,所述程序致使所述計算機起到如下單元的作用發(fā)言識別單元,通過用戶的語音輸入識別用戶的發(fā)言內(nèi)容,并輸出識別結果;對話控制處理單元,根據(jù)所述識別結果控制與用戶的對話進程,以便確定對所述用戶的響應內(nèi)容;發(fā)言特征分析單元,分析所述用戶的發(fā)言特征,產(chǎn)生發(fā)言特征信息;和響應語音產(chǎn)生單元,根據(jù)所述響應內(nèi)容和所述發(fā)言特征信息產(chǎn)生針對所述用戶的響應語音。附圖說明圖1是說明本專利技術實施例的語音識別/響應系統(tǒng)的示意性結構的方框圖; 圖2是本專利技術的例子的語音識別/響應系統(tǒng)的方框圖;圖3是發(fā)言特征類別選擇處理的流程圖;圖4是響應語音產(chǎn)生處理的流程圖;圖5是語音產(chǎn)生處理的另一個流程圖;圖6A是說明響應數(shù)據(jù)庫的讀取數(shù)據(jù)庫中存儲內(nèi)容的例1的視圖,圖6B是說明它的例2的視圖;圖7是本專利技術第一修改的語音識別/響應處理的流程圖;圖8是說明本專利技術第二修改的處理流程的視圖;圖9是本專利技術第二修改的語音識別/響應處理的流程圖;具體實施方式現(xiàn)在,將參考相關附圖對本專利技術的最佳實施例進行詳細說明。圖1說明本專利技術實施例的語音識別/響應系統(tǒng)的示意結構。本專利技術實施例的語音識別/響應系統(tǒng)1,輸出針對用戶發(fā)言產(chǎn)生的語音輸入的語音響應,從而實現(xiàn)和用戶的語音對話,可以應用于具有各種語音響應功能的裝置或設備,例如汽車導航系統(tǒng)、家用電器和視頻-音頻設備。產(chǎn)生語音識別/響應程序來實現(xiàn)本專利技術實施例的語音識別/響應系統(tǒng),并且通過記錄介質(zhì)或通信裝置在終端設備上安裝上述程序來執(zhí)行它,使終端設備能夠起到語音識別/響應系統(tǒng)的作用。在這種情況下,上述終端設備可以包括各種信息終端,例如汽車導航系統(tǒng)、家用電器和視頻-音頻設備。語音識別/響應系統(tǒng)1大致地分成如下結構部件發(fā)言識別單元10、發(fā)言特征分析單元20、響應語音產(chǎn)生單元30和對話控制處理單元40。發(fā)言識別單元10接收用戶發(fā)言產(chǎn)生的語音輸入,執(zhí)行語音識別處理和其它識別所述發(fā)言內(nèi)容的處理,并且輸出作為識別結果的識別關鍵字S1。在識別用戶發(fā)言的每詞時,所述識別關鍵字S1是作為識別結果獲得的。從發(fā)言識別單元10輸出的識別關鍵字S1被發(fā)送到發(fā)言特征分析單元20和對話控制處理單元40。發(fā)言特征分析單元20根據(jù)識別關鍵字分析用戶的發(fā)言特征。所述發(fā)言特征包括各種特征,例如用戶的地區(qū)性、用戶的當前環(huán)境等等,這些特征也許會影響用戶的發(fā)言。發(fā)言特征分析單元20根據(jù)識別關鍵字S1分析發(fā)言特征,產(chǎn)生發(fā)言特征信息S2并且將它發(fā)送到響應語音產(chǎn)生單元30。對話控制處理單元40根據(jù)識別關鍵字S1控制同用戶的對話進程。對話進程的確定應當考慮到如下因素例如,使用了本專利技術的語音識別/響應系統(tǒng)設備的系統(tǒng)信息,以便根據(jù)預先準備好的對話情景進行控制。對話控制處理單元40確定對話情景(這將要根據(jù)系統(tǒng)信息和其它當前環(huán)境信息進展)使對話情景能夠根據(jù)相應于用戶發(fā)言內(nèi)容的識別關鍵字S1進展,從而實現(xiàn)對話。然后,對話控制處理單元40根據(jù)對話進度產(chǎn)生響應語音信息S3,通過它來確定隨后要輸出的語音響應,并發(fā)送這樣產(chǎn)生的響應語音信息S3到響應語音產(chǎn)生單元30。響應語音產(chǎn)生單元30產(chǎn)生這樣的語音響應,該語音響應具有如下模式相應于對話控制處理單元40給出的響應語音信息S3和由發(fā)言特征信息S2所代表的發(fā)言特征,并通過諸如擴音器這樣的語音輸出裝置輸出語音響應。本專利技術實施例的語音識別/響應系統(tǒng)1以這種方式,根據(jù)用戶的發(fā)言狀態(tài)輸出基于發(fā)言特征的語音響應。舉例現(xiàn)在,對最佳實施例進行如下描述。圖2是根據(jù)本專利技術的例子的語音識別/響應系統(tǒng)100的方框圖,它可以實現(xiàn)針對用戶發(fā)言的適當?shù)恼Z音響應。如圖2所示,語音識別/響應系統(tǒng)100大致地分成如下結構部件發(fā)言識別單元10、發(fā)言特征分析單元20、響應語音產(chǎn)生單元30和對話控制處理單元40。發(fā)言識別單元10包括參數(shù)轉換部分12和語音識別處理部分14。參數(shù)轉換部分12將語音(通過他/她的發(fā)言已經(jīng)由用戶輸入)轉換成指示語音特征的特征參數(shù)。語音識別處理部分14實施由參數(shù)轉換部分12獲得的特征參數(shù)和關鍵字模型(它們已經(jīng)預先包括在語音識別引擎中)之間的匹配處理,以便抽取識別關鍵字。在本專利技術的例子中,語音識別處理部分14配置為使用每詞中的關鍵字實施匹配處理以便執(zhí)行識別處理。識別關鍵字是包含在用戶發(fā)言中的詞以及這樣的關鍵字,所述關鍵字已經(jīng)通過語音識別處理加以識別。發(fā)言特征分析單元20包括發(fā)言特征類別選擇部分22和發(fā)言特征數(shù)據(jù)庫(DB)24。發(fā)言特征類別選擇部分22使用發(fā)言特征參數(shù)來選擇發(fā)言特征類別,該特征參數(shù)相應于由語音識別處理部分14抽取的識別關鍵字。發(fā)言特征參數(shù)包括這樣的值,該值是關于被分類為各種元素的特征的出現(xiàn)頻率。在要判斷發(fā)言中的用戶是生于日本關東(Kanto)地區(qū)的人(以下簡稱關東人),還是生于日本關西(Kansai)地區(qū)的人(以下稱為關西人)的情況下,例如,發(fā)言特征參數(shù)采用下列多元值的形式存儲在本文檔來自技高網(wǎng)...
【技術保護點】
【技術特征摘要】
1.一種語音識別/響應系統(tǒng),包括發(fā)言識別單元(10),通過用戶的語音輸入識別用戶的發(fā)言內(nèi)容,并且輸出識別結果;對話控制處理單元(40),根據(jù)所述識別結果控制同用戶的對話進程,以便確定針對所述用戶的響應內(nèi)容;發(fā)言特征分析單元(20),分析所述用戶的發(fā)言特征以便產(chǎn)生發(fā)言特征信息;和響應語音產(chǎn)生單元(30),根據(jù)所述響應內(nèi)容和所述發(fā)言特征信息產(chǎn)生針對所述用戶的響應語音。2.根據(jù)權利要求1的系統(tǒng),其中所述發(fā)言特征信息包括多個發(fā)言特征類別,所述發(fā)言特征類別通過將用戶的發(fā)言特征分類為多個組獲得,所述發(fā)言特征分析單元(20)根據(jù)所述識別結果從所述多個發(fā)言特征類別中選擇發(fā)言特征類別,以便輸出所述發(fā)言特征類別。3.根據(jù)權利要求2的系統(tǒng),其中所述多個發(fā)言特征類別包括與所述用戶的地區(qū)性有關的參數(shù)。4.根據(jù)權利要求2或3的系統(tǒng),其中所述發(fā)言特征分析單元(20)包括數(shù)據(jù)庫(24),用于存儲所述發(fā)言特征參數(shù),它們被用于選擇與所述用戶的發(fā)言有關的所述發(fā)言特征類別;和裝置(22),用于使用相應于所述識別結果的...
【專利技術屬性】
技術研發(fā)人員:小林載,市原直彥,小田川智,
申請(專利權)人:日本先鋒公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。