基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)制造方法及圖紙

技術(shù)編號：20162397 閱讀：88 留言：0更新日期：2019-01-19 00:15

本發(fā)明專利技術(shù)實(shí)施例公開了一種基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)。其中，該方法包括：采集至少兩個語音信號；依據(jù)采集所述至少兩個語音信號的時(shí)間及各語音信號與當(dāng)前場景的匹配度，確定用戶的意圖。本發(fā)明專利技術(shù)實(shí)施例提供的技術(shù)方案，能夠在存在多路語音信號及外部環(huán)境干擾的情況下，準(zhǔn)確確定用戶對終端的控制指令，從而提升了用戶的體驗(yàn)。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】
基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)
本專利技術(shù)實(shí)施例涉及語音識別
，尤其涉及一種基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)。
技術(shù)介紹
目前，語音識別技術(shù)在汽車駕艙中的應(yīng)用越來越廣泛。語音交互能夠讓駕駛員和車內(nèi)乘客能夠更自然，更快速的訪問車內(nèi)服務(wù)，同時(shí)也避免了由于駕駛員視線離開路面可能產(chǎn)生的危險(xiǎn)和事故。但是現(xiàn)有的語音識別技術(shù)在車內(nèi)環(huán)境比較嘈雜的情況，不能準(zhǔn)確的確定用戶對車載終端的控制指令。例如當(dāng)用戶正在說出語音指令的時(shí)候，如果旁邊有其他人在閑聊或者發(fā)出聲音產(chǎn)生干擾語音，則很難根據(jù)上述多個語音確定出語音指令對應(yīng)的控制指令，導(dǎo)致無法對車載終端進(jìn)行準(zhǔn)確的控制，從而影響語音交互的效果。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)實(shí)施例提供了一種基于語音的控制方法、裝置、設(shè)備和存儲介質(zhì)，能夠準(zhǔn)確識確定用戶對終端的控制指令，提升了用戶的體驗(yàn)。第一方面，本專利技術(shù)實(shí)施例提供了一種基于語音的控制方法，該方法包括：采集至少兩個語音信號；依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度，確定對終端的目標(biāo)控制指令。第二方面，本專利技術(shù)實(shí)施例還提供了一種基于語音的控制裝置，該裝置包括：采集模塊，用于采集至少兩個語音信號；目標(biāo)指令確定模塊，用于依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度，確定對終端的目標(biāo)控制指令。第三方面，本專利技術(shù)實(shí)施例還提供了一種設(shè)備，該設(shè)備包括：一個或多個處理器；存儲裝置，用于存儲一個或多個程序；當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行，使得所述一個或多個處理器實(shí)現(xiàn)第一方面中任意所述的基于語音的控制方法。第四...

【技術(shù)保護(hù)點(diǎn)】
1.一種基于語音的控制方法，其特征在于，包括：采集至少兩個語音信號；依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度，確定對終端的目標(biāo)控制指令。

【技術(shù)特征摘要】
1.一種基于語音的控制方法，其特征在于，包括：采集至少兩個語音信號；依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度，確定對終端的目標(biāo)控制指令。2.根據(jù)權(quán)利要求1所述的方法，其特征在于，依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度，確定對終端的目標(biāo)控制指令，包括：采用預(yù)設(shè)規(guī)則對所述至少兩個語音信號進(jìn)行處理，得到所述至少兩個語音信號中各語音信號中的目標(biāo)信號對應(yīng)的文本內(nèi)容及各目標(biāo)信號的起始時(shí)間；向語義理解引擎輸入各文本內(nèi)容，得到各目標(biāo)信號與當(dāng)前場景的匹配度；依據(jù)各匹配度及各目標(biāo)信號的起始時(shí)間，確定對終端的目標(biāo)控制指令。3.根據(jù)權(quán)利要求2所述的方法，其特征在于，采用預(yù)設(shè)規(guī)則對所述至少兩個語音信號進(jìn)行處理，得到所述至少兩個語音信號中各語音信號中的目標(biāo)信號對應(yīng)的文本內(nèi)容及各目標(biāo)信號的起始時(shí)間，包括：采用波束成形算法對所述至少兩個語音信號進(jìn)行處理，得到所述至少兩個語音信號中各語音信號對應(yīng)的初步語音信號；對各初步語音信號進(jìn)行語音端點(diǎn)檢測得到各初步語音信號對應(yīng)的目標(biāo)信號及各目標(biāo)信號的起始時(shí)間；對各目標(biāo)信號進(jìn)行語音識別，得到各目標(biāo)信號對應(yīng)的文本內(nèi)容。4.根據(jù)權(quán)利要求1所述的方法，其特征在于，采集至少兩個語音信號，包括：采用語音采集系統(tǒng)采集至少兩個語音信號，其中，所述語音采集系統(tǒng)包括至少兩對由兩個麥克風(fēng)組成的雙麥單元，每對雙麥單元的位置依據(jù)對應(yīng)的發(fā)聲點(diǎn)的位置確定。5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述每對雙麥單元的位置由如下操作確定：依據(jù)發(fā)聲點(diǎn)的位置和預(yù)設(shè)的安裝平面確定該發(fā)聲點(diǎn)在安裝平面上的投影點(diǎn)；依據(jù)所述投影點(diǎn)的位置和中心點(diǎn)位置之間的第一距離，以及所述第一...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：楊亮，雷宇，
申請(專利權(quán))人：北京智能管家科技有限公司，
類型：發(fā)明
國別省市：北京,11

全部詳細(xì)技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)

基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)制造方法及圖紙

基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)制造方法及圖紙