本發明專利技術所涉及的語音識別裝置包括:語音獲取部(1),該語音獲取部(1)對所輸入的語音進行數字轉換,并作為語音數據來獲取該數據;語音數據存儲部(2),該語音數據存儲部(2)對語音獲取部(1)所獲取的語音數據進行存儲;第一~第M語音識別部,該第一~第M語音識別部從語音數據存儲部(2)所存儲的語音數據中檢測語音區間,提取出語音區間的語音數據的特征量,基于所提取出的特征量并參照識別詞典來進行識別處理;語音識別切換部(4),該語音識別切換部(4)對第一~第M語音識別部進行切換;識別控制部(5),該識別控制部(5)對語音識別切換部(4)所進行的語音識別部的切換進行控制,以獲取切換后的語音識別部的識別結果;以及識別結果選擇部(6),該識別結果選擇部(6)從識別控制部(5)所獲取的識別結果中選擇提示給用戶的提示對象的識別結果。
【技術實現步驟摘要】
【國外來華專利技術】語音識別裝置及導航裝置
本專利技術涉及語音識別裝置及包括該裝置的導航裝置。
技術介紹
在現有的車載導航裝置中,一般具有語音輸入Ι/F以實現對地址、設施名稱進行語音識別的功能。然而,由于安裝作為車載導航裝置的硬件的工作存儲器及運算能力的限制、識別率的問題,有時難以將地址、設施名稱等大量的詞匯作為一次性識別的對象。對此,例如在專利文獻I中,公開了一種將語音識別對象進行分割以分多次實施識別的語音識別裝置。在該裝置中,將語音識別對象進行分割并依次進行語音識別,若識別結果的識別分值(匹配度)在閾值以上,則確定其識別結果并結束處理。另外,當識別分值在上述閾值以上的識別結果一個也沒有時,將所獲得的識別結果中識別分值最高的識別結果作為最終的識別結果。這樣,能通過將語音識別對象進行分割來防止識別率的下降。另外,由于在識別結果的識別分值為閾值以上的時刻結束處理,因此,能縮短識別處理所需的時間。現有技術文獻專利文獻專利文獻1:日本專利特開2009-230068號公報
技術實現思路
專利技術所要解決的技術問題在專利文獻I所代表的現有技術中,例如在通過語法型或聽寫型等不同的語音識別處理來依次進行識別的情況下,無法單純比較識別結果各自的識別分值(匹配度)。因此,當識別分值在上述閾值以上的識別結果一個也沒有時,存在以下問題:即,無法選擇所獲得的識別結果中識別分值最高的識別結果,從而無法對用戶提示識別結果。本專利技術是為了解決上述那樣的問題而完成的,其目的在于獲得一種能正確提示由不同的語音識別處理所獲得的識別結果、并能力圖縮短識別處理時間的語音識別裝置及包括該裝置的導航裝置。解決技術問題所采用的技術方案本專利技術所涉及的語音識別裝置包括:獲取部,該獲取部對所輸入的語音進行數字轉換,并作為語音數據獲取該數據;語音數據存儲部,該語音數據存儲部對獲取部所獲取的語音數據進行存儲;多個語音識別部,該多個語音識別部從語音數據存儲部所存儲的語音數據中檢測語音區間,提取出語音區間的語音數據的特征量,基于所提取出的特征量并參照識別詞典來進行識別處理;切換部,該切換部對多個語音識別部進行切換;控制部,該控制部對切換部所進行的語音識別部的切換進行控制,以獲取切換后的語音識別部的識別結果;以及選擇部,該選擇部從控制部所獲取的識別結果中選擇提示給用戶的提示對象的識別結果。專利技術效果根據本專利技術,具有以下效果:即,能正確地提示由不同的語音識別處理所獲得的識別結果,并能力圖縮短識別處理時間。【附圖說明】圖1是表示包括本專利技術的實施方式I所涉及的語音識別裝置的導航裝置的結構的框圖。圖2是表示實施方式I所涉及的語音識別裝置所進行的語音識別處理的流程的流程圖。 圖3是表示每個語音識別部的識別分值為上位至第2位的識別結果的顯示例的圖。圖4是表示利用每個語音識別部各自不同的方法所選出的識別結果的顯示例的圖。圖5是表示本專利技術的實施方式2所涉及的語音識別裝置的結構的框圖。圖6是表示本專利技術的實施方式3所涉及的語音識別裝置的結構的框圖。圖7是表示實施方式3所涉及的語音識別裝置所進行的語音識別處理的流程的流程圖。圖8是表示本專利技術的實施方式4所涉及的語音識別裝置的結構的框圖。圖9是表示實施方式4所涉及的語音識別裝置所進行的語音識別處理的流程的流程圖。圖10是表示本專利技術的實施方式5所涉及的語音識別裝置的結構的框圖。圖11是表示實施方式5所涉及的語音識別裝置所進行的語音識別處理的流程的流程圖。【具體實施方式】下面,為了對本專利技術進行更加詳細的說明,參照附圖對本專利技術的實施方式進行說明。實施方式1.圖1是表示包括本專利技術的實施方式I所涉及的語音識別裝置的導航裝置的結構的框圖。在圖1中,示出了實施方式I所涉及的導航裝置將實施方式I所涉及的語音識別裝置應用于搭載在作為移動體的車輛上的車載用導航裝置的情況。作為語音識別裝置的結構,其包括:語音獲取部1、語音數據存儲部2、語音識別部3、語音識別切換部4、識別控制部5、識別結果選擇部6以及識別結果存儲部7,作為進行導航的結構,包括:顯示部8、導航處理部9、位置檢測部10、地圖數據庫(DB) 11以及輸入部12。語音獲取部I是對利用麥克風等輸入的規定期間的語音進行模數轉換、并作為例如PCM (Pulse Code Modulation:脈沖編碼調制)格式的語音數據來獲取該數據的獲取部。語音數據存儲部2是對由語音獲取部I所獲取的語音數據進行存儲的存儲部。語音識別部3由例如進行語法型或聽寫型等不同的語音識別處理的多個語音識別部(以下記載為第一?第M語音識別部)所構成。第一?第M語音識別部根據各語音識別算法,從語音獲取部I所獲取的語音數據中檢測出屬于用戶說話內容的語音區間,提取出該語音區間中的語音數據的特征量,基于所提取出的特征量,一邊參照識別詞典,一邊進行識別處理。語音識別切換部4是根據來自識別控制部5的切換控制信號來對第一?第M語音識別部進行切換的切換部。識別控制部5是對語音識別切換部4所進行的語音識別部的切換進行控制、以獲取切換后的語音識別部的識別結果的控制部。識別結果選擇部6是從識別控制部5所獲取的識別結果中選出要輸出的識別結果的選擇部。識別結果存儲部7是對識別結果選擇部6所選擇的識別結果進行存儲的存儲部。顯示部8是顯示存儲于識別結果存儲部7的識別結果或導航處理部9的處理結果的顯示部。導航處理部9是進行路線計算、路線引導及地圖顯示等導航處理的功能結構部。例如,導航處理部9利用位置檢測部10所獲取的本車的當前位置、實施方式I所涉及的語音識別裝置或輸入部12所輸入的目的地以及地圖數據庫(DB) 11所存儲的地圖數據,來計算從當前的本車位置到目的地的路線。然后,導航處理部9對通過路線計算獲得的路線進行指引引導。另外,導航處理部9利用本車的當前位置及地圖DBll所存儲的地圖數據,將包含本車位置的地圖顯示于顯示部8。位置檢測部10是根據GPS (Global Positioning System:全球定位系統)電波等的分析結果來獲取本車的位置信息(緯度經度)的功能結構部。另外,地圖DBll是登錄有導航處理部9所使用的地圖數據的數據庫。地圖數據中包括地形圖數據、住宅地圖數據及道路網絡等。輸入部12是接受用戶所進行的目的地的設定輸入或各種操作的功能結構部,例如由搭載在顯示部8的畫面上的觸摸面板等來實現。下面,對動作進行說明。圖2是表示實施方式I所涉及的語音識別裝置所進行的語音識別處理的流程的流程圖。首先,語音獲取部I對利用麥克風等所輸入的規定期間的語音進行Α/D轉換,并作為例如PCM格式的語音數據來獲取該數據(步驟ST10)。語音數據存儲部2對語音獲取部I所獲取的語音數據進行存儲(步驟ST20)。接著,識別控制部5將變量N初始化為I (步驟ST30)。其中,N是可取I?M的值的變量。然后,識別控制部5向語音識別切換部4輸出將語音識別部3切換成第N語音識別部的切換控制信號。語音識別切換部4根據來自識別控制部5的該切換控制信號,將語音識別部3切換成第N語音識別部(步驟ST40)。第N語音識別部從語音數據存儲部2所存儲的語音數據中檢測出屬于用戶說話內容的語音區間,提取出該語音區間中的語音數據的特征量,基于該特征量,一邊參照識別詞典,一邊進行識別處理(步驟ST50 )。識別控制本文檔來自技高網...
【技術保護點】
一種語音識別裝置,其特征在于,包括:獲取部,該獲取部對所輸入的語音進行數字轉換,并作為語音數據來獲取該數據;語音數據存儲部,該語音數據存儲部對所述獲取部所獲取的語音數據進行存儲;多個語音識別部,該多個語音識別部從所述語音數據存儲部所存儲的語音數據中檢測語音區間,提取出所述語音區間的語音數據的特征量,基于所提取出的所述特征量并參照識別詞典來進行識別處理;切換部,該切換部對所述多個語音識別部進行切換;控制部,該控制部對所述切換部所進行的語音識別部的切換進行控制,以獲取切換后的語音識別部的識別結果;以及選擇部,該選擇部從所述控制部所獲取的識別結果中選擇提示給用戶的提示對象的識別結果。
【技術特征摘要】
【國外來華專利技術】1.一種語音識別裝置,其特征在于,包括: 獲取部,該獲取部對所輸入的語音進行數字轉換,并作為語音數據來獲取該數據; 語音數據存儲部,該語音數據存儲部對所述獲取部所獲取的語音數據進行存儲; 多個語音識別部,該多個語音識別部從所述語音數據存儲部所存儲的語音數據中檢測語音區間,提取出所述語音區間的語音數據的特征量,基于所提取出的所述特征量并參照識別詞典來進行識別處理; 切換部,該切換部對所述多個語音識別部進行切換; 控制部,該控制部對所述切換部所進行的語音識別部的切換進行控制,以獲取切換后的語音識別部的識別結果;以及 選擇部,該選擇部從所述控制部所獲取的識別結果中選擇提示給用戶的提示對象的識別結果。2.一種語音識別裝置,其特征在于,包括: 獲取部,該獲取部對所輸入的語音進行數字轉換,并作為語音數據來獲取該數據; 語音區間檢測部,該語音區間檢測部從所述獲取部所獲取的語音數據中檢測出屬于用戶說話內容的語音區間; 語音數據存儲部,該語音數據存儲部對所述語音區間檢測部所檢測到的每個語音區間的語音數據進行存儲; 多個語音識別部,該多個語音識別部提取出所述語音數據存儲部所存儲的語音數據的特征量,基于所提取出的所述特征量并參照識別詞典來進行識別處理; 切換部,該切換部對所述多個語音識別部進行切換; 控制部,該控制部對所述切換部所進行的語音識別部的切換進行控制,以獲取切換后的語音識別部的識別結果;以及 選擇部,該選擇部從所述控制部所獲取的識別結果中選擇提示給用戶的提示對象的識別結果...
【專利技術屬性】
技術研發人員:石井純,山崎道弘,
申請(專利權)人:三菱電機株式會社,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。