• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)制造方法及圖紙

    技術(shù)編號:20162397 閱讀:88 留言:0更新日期:2019-01-19 00:15
    本發(fā)明專利技術(shù)實(shí)施例公開了一種基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)。其中,該方法包括:采集至少兩個語音信號;依據(jù)采集所述至少兩個語音信號的時(shí)間及各語音信號與當(dāng)前場景的匹配度,確定用戶的意圖。本發(fā)明專利技術(shù)實(shí)施例提供的技術(shù)方案,能夠在存在多路語音信號及外部環(huán)境干擾的情況下,準(zhǔn)確確定用戶對終端的控制指令,從而提升了用戶的體驗(yàn)。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)
    本專利技術(shù)實(shí)施例涉及語音識別
    ,尤其涉及一種基于語音的控制方法、裝置、設(shè)備及存儲介質(zhì)。
    技術(shù)介紹
    目前,語音識別技術(shù)在汽車駕艙中的應(yīng)用越來越廣泛。語音交互能夠讓駕駛員和車內(nèi)乘客能夠更自然,更快速的訪問車內(nèi)服務(wù),同時(shí)也避免了由于駕駛員視線離開路面可能產(chǎn)生的危險(xiǎn)和事故。但是現(xiàn)有的語音識別技術(shù)在車內(nèi)環(huán)境比較嘈雜的情況,不能準(zhǔn)確的確定用戶對車載終端的控制指令。例如當(dāng)用戶正在說出語音指令的時(shí)候,如果旁邊有其他人在閑聊或者發(fā)出聲音產(chǎn)生干擾語音,則很難根據(jù)上述多個語音確定出語音指令對應(yīng)的控制指令,導(dǎo)致無法對車載終端進(jìn)行準(zhǔn)確的控制,從而影響語音交互的效果。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)實(shí)施例提供了一種基于語音的控制方法、裝置、設(shè)備和存儲介質(zhì),能夠準(zhǔn)確識確定用戶對終端的控制指令,提升了用戶的體驗(yàn)。第一方面,本專利技術(shù)實(shí)施例提供了一種基于語音的控制方法,該方法包括:采集至少兩個語音信號;依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度,確定對終端的目標(biāo)控制指令。第二方面,本專利技術(shù)實(shí)施例還提供了一種基于語音的控制裝置,該裝置包括:采集模塊,用于采集至少兩個語音信號;目標(biāo)指令確定模塊,用于依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度,確定對終端的目標(biāo)控制指令。第三方面,本專利技術(shù)實(shí)施例還提供了一種設(shè)備,該設(shè)備包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序;當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實(shí)現(xiàn)第一方面中任意所述的基于語音的控制方法。第四方面,本專利技術(shù)實(shí)施例還提供了一種存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面中任意所述的基于語音的控制方法。本專利技術(shù)實(shí)施例提供的技術(shù)方案,通過對語音采集系統(tǒng)采集的各語音信號按照采集時(shí)間和與當(dāng)前場景的匹配來確定對終端的控制指令,該方案能夠在存在多路語音信號及外部環(huán)境干擾的情況下,準(zhǔn)確確定用戶對終端的控制指令,從而提升了用戶的體驗(yàn)。附圖說明圖1A是本專利技術(shù)實(shí)施例一中提供的一種基于語音的控制方法的流程圖;圖1B是本專利技術(shù)實(shí)施例所適用的一種語音采集系統(tǒng)的示意圖;圖2是本專利技術(shù)實(shí)施例二中提供的一種基于語音的控制方法的流程圖;圖3是本專利技術(shù)實(shí)施例三中提供的一種基于語音的控制方法的流程圖;圖4是本專利技術(shù)實(shí)施例四中提供的一種基于語音的控制裝置的結(jié)構(gòu)框圖;圖5是本專利技術(shù)實(shí)施例五中提供的一種設(shè)備的結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合附圖和實(shí)施例對本專利技術(shù)實(shí)施例作進(jìn)一步的詳細(xì)說明。可以理解的是,此處所描述的具體實(shí)施例僅僅用于解釋本專利技術(shù)實(shí)施例,而非對本專利技術(shù)的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本專利技術(shù)實(shí)施例相關(guān)的部分而非全部結(jié)構(gòu)。實(shí)施例一圖1A為本專利技術(shù)實(shí)施例一中提供的一種基于語音的控制方法的流程圖,本實(shí)施適用于如何準(zhǔn)確確定用戶對終端的控制指令,尤其適用于解決座位固定的車輛環(huán)境下,如何在車內(nèi)存在多個語音等外部干擾的情況下準(zhǔn)確確定用戶對終端的控制指令。該方法可以由本專利技術(shù)實(shí)施例提供的基于語音的控制裝置來執(zhí)行,該裝置可采用軟件和/或硬件的方式實(shí)現(xiàn)。參見圖1A,該方法具體包括:S110,采集至少兩個語音信號。其中,語音信號是指包含用戶語音指令的信號,可采用麥克風(fēng)等采集設(shè)備來采集。示例性的,可采用語音采集系統(tǒng)采集至少兩個語音信號,其中,語音采集系統(tǒng)是預(yù)先構(gòu)建的,用于對語音信號進(jìn)行采集;可選的,語音采集系統(tǒng)可以由多個麥克風(fēng)或麥克風(fēng)陣列組成。對于車輛座位固定的環(huán)境下,為了能夠在車內(nèi)語音等干擾即存在多路語音信號的情況下,準(zhǔn)確識別出車輛內(nèi)任一人員的意圖,例如識別駕駛員或副駕駛員的意圖??梢罁?jù)車輛內(nèi)的座位構(gòu)造構(gòu)建語音采集系統(tǒng),可選的,語音采集系統(tǒng)包括至少兩對由兩個麥克風(fēng)組成的雙麥單元,每對雙麥單元的位置依據(jù)對應(yīng)的發(fā)聲點(diǎn)的位置確定。其中,兩個麥克風(fēng)視為一對雙麥單元,發(fā)聲點(diǎn)即為車內(nèi)人員的嘴巴,發(fā)聲點(diǎn)位置正對兩個麥克風(fēng)連線的中垂線,也就是說,每對雙麥單元的兩個麥克風(fēng)之間連線的中垂面上包括發(fā)聲點(diǎn),每個發(fā)聲點(diǎn)對應(yīng)一對雙麥單元。示例性的,每對雙麥單元的位置可以由用戶或位置確定模型執(zhí)行如下操作確定,其中,位置確定模型是預(yù)先訓(xùn)練的可用于確定每對雙麥單元位置的模型,將發(fā)聲點(diǎn)的位置、預(yù)設(shè)的安裝平面及中心點(diǎn)位置輸入位置確定模型,模型就會結(jié)合自身的參數(shù),輸出該對雙麥的安裝位置。A、依據(jù)發(fā)聲點(diǎn)的位置和預(yù)設(shè)的安裝平面確定該發(fā)聲點(diǎn)在安裝平面上的投影點(diǎn)。其中,預(yù)設(shè)的安裝平面是指預(yù)先設(shè)置的用于安裝麥克風(fēng)的平面,如中控臺。需要說明的是,由于車內(nèi)座位的構(gòu)造,不同的發(fā)聲點(diǎn)可對應(yīng)不同的安裝平面,也可以對應(yīng)相同的安裝平面。且,由于人身高的不同,將導(dǎo)致發(fā)聲點(diǎn)的位置變化,從而導(dǎo)致麥克風(fēng)的位置不固定,因此為了便于固定麥克風(fēng),在可控范圍內(nèi)如3-5度,采用標(biāo)準(zhǔn)身高或平均身高來設(shè)定發(fā)聲點(diǎn)的位置。例如,參見圖1B所示,由于駕駛員和副駕駛員均位于車內(nèi)前排,因此可在同一安裝平面內(nèi)為每個人員設(shè)置與其對應(yīng)的雙麥單元。具體的,兩個發(fā)聲點(diǎn)位置分別為正駕駛員的嘴巴所在位置S1和副駕駛員的嘴巴所在位置S2;安裝平面為M1。在垂直平面內(nèi),經(jīng)過發(fā)聲點(diǎn)位置向安裝平面做垂線,該垂線與安裝平面的交點(diǎn)即為發(fā)聲點(diǎn)在安裝平面上的投影點(diǎn)。例如,參見圖1B所示,過點(diǎn)S1向安裝平面M1做垂線,與安裝平面M1的交點(diǎn)即為投影點(diǎn)S1/;過點(diǎn)S2向安裝平面M1做垂線,與安裝平面M1的交點(diǎn)即為投影點(diǎn)S2/。B、依據(jù)投影點(diǎn)的位置和中心點(diǎn)位置之間的第一距離,以及第一距離與第二距離之間的線性關(guān)系,確定發(fā)聲點(diǎn)對應(yīng)的雙麥單元的安裝位置。其中,中心點(diǎn)位置依據(jù)發(fā)聲點(diǎn)預(yù)先設(shè)置,每個發(fā)聲點(diǎn)對應(yīng)一個中心點(diǎn),具體的,中心點(diǎn)位置是指車內(nèi)人員如駕駛員正對的安裝平面區(qū)域的位置。例如,圖1B中S1對應(yīng)的中心點(diǎn)位置即S1正對的安裝平面的位置O1和S2對應(yīng)的中心點(diǎn)位置即S2正對的安裝平面的位置O2;以及三個麥克風(fēng)MIC1、MIC0和MIC2。針對每個麥克風(fēng),該麥克風(fēng)的位置和中心點(diǎn)位置之間的距離即為即為第二距離,例如圖1B中的MIC1與O1之間的距離。投影點(diǎn)的位置和中心點(diǎn)位置之間的距即為第一距離,例如圖1B中的S1/與O1之間的距離。可選的,投影點(diǎn)的位置和中心點(diǎn)位置之間的第一距離是麥克風(fēng)的位置和中心點(diǎn)位置之間的第二距離的50倍,例如圖1B中的S1/與O1之間的距離S1/O1是MIC1與O1之間的距離的50倍。具體的,在確定發(fā)聲點(diǎn)對應(yīng)的投影點(diǎn)以及依據(jù)發(fā)聲點(diǎn)預(yù)先確定中心點(diǎn)位置之后,依據(jù)投影點(diǎn)的位置和中心點(diǎn)位置之間的第一距離與麥克風(fēng)的位置和中心點(diǎn)位置之間的第二距離的線性關(guān)系,可唯一確定每對雙麥單元中每個麥克風(fēng)的位置。需要說明的是,通常情況下一個發(fā)聲點(diǎn)對應(yīng)一對雙麥單元,若兩個發(fā)聲點(diǎn)對應(yīng)的兩對雙麥單元的安裝位置存在重疊,可采用共用麥克風(fēng)的形式構(gòu)建語音采集系統(tǒng),如圖1B所示,由三個麥克風(fēng)組成的兩對雙麥單元,即駕駛員對應(yīng)的雙麥單元MIC1和MIC0,副駕駛員對應(yīng)的雙麥單元MIC2和MIC0。示例性的,可根據(jù)車輛內(nèi)座位的構(gòu)造,設(shè)置與位置個數(shù)相同的雙麥對。例如,對應(yīng)具有五個位置的車輛,可在車控臺上設(shè)置兩對雙麥分別對應(yīng)駕駛員和副駕駛員,在前排座位后面相應(yīng)的設(shè)置三對雙麥分別對應(yīng)后排的三個人員。需要說明的是,采用該種構(gòu)建方式設(shè)置的語音采集系統(tǒng),一對本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】
    1.一種基于語音的控制方法,其特征在于,包括:采集至少兩個語音信號;依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度,確定對終端的目標(biāo)控制指令。

    【技術(shù)特征摘要】
    1.一種基于語音的控制方法,其特征在于,包括:采集至少兩個語音信號;依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度,確定對終端的目標(biāo)控制指令。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,依據(jù)采集所述至少兩個語音信號的時(shí)間及所述至少兩個語音信號與當(dāng)前場景的匹配度,確定對終端的目標(biāo)控制指令,包括:采用預(yù)設(shè)規(guī)則對所述至少兩個語音信號進(jìn)行處理,得到所述至少兩個語音信號中各語音信號中的目標(biāo)信號對應(yīng)的文本內(nèi)容及各目標(biāo)信號的起始時(shí)間;向語義理解引擎輸入各文本內(nèi)容,得到各目標(biāo)信號與當(dāng)前場景的匹配度;依據(jù)各匹配度及各目標(biāo)信號的起始時(shí)間,確定對終端的目標(biāo)控制指令。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,采用預(yù)設(shè)規(guī)則對所述至少兩個語音信號進(jìn)行處理,得到所述至少兩個語音信號中各語音信號中的目標(biāo)信號對應(yīng)的文本內(nèi)容及各目標(biāo)信號的起始時(shí)間,包括:采用波束成形算法對所述至少兩個語音信號進(jìn)行處理,得到所述至少兩個語音信號中各語音信號對應(yīng)的初步語音信號;對各初步語音信號進(jìn)行語音端點(diǎn)檢測得到各初步語音信號對應(yīng)的目標(biāo)信號及各目標(biāo)信號的起始時(shí)間;對各目標(biāo)信號進(jìn)行語音識別,得到各目標(biāo)信號對應(yīng)的文本內(nèi)容。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,采集至少兩個語音信號,包括:采用語音采集系統(tǒng)采集至少兩個語音信號,其中,所述語音采集系統(tǒng)包括至少兩對由兩個麥克風(fēng)組成的雙麥單元,每對雙麥單元的位置依據(jù)對應(yīng)的發(fā)聲點(diǎn)的位置確定。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述每對雙麥單元的位置由如下操作確定:依據(jù)發(fā)聲點(diǎn)的位置和預(yù)設(shè)的安裝平面確定該發(fā)聲點(diǎn)在安裝平面上的投影點(diǎn);依據(jù)所述投影點(diǎn)的位置和中心點(diǎn)位置之間的第一距離,以及所述第一...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:楊亮雷宇,
    申請(專利權(quán))人:北京智能管家科技有限公司,
    類型:發(fā)明
    國別省市:北京,11

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲av无码一区二区三区人妖| 日韩人妻无码精品一专区| 久久亚洲精品无码网站| 免费A级毛片无码A| 无码人妻一区二区三区免费看| 亚洲AV无码不卡在线播放| 无码国产精品一区二区免费vr| 丰满亚洲大尺度无码无码专线 | 久久午夜夜伦鲁鲁片免费无码影视 | 亚洲最大天堂无码精品区| 精品人妻无码专区中文字幕| 亚洲av无码一区二区三区观看| 午夜无码中文字幕在线播放 | 精品亚洲成在人线AV无码| 亚洲精品人成无码中文毛片| 精品无码人妻一区二区免费蜜桃 | 无码人妻精品一区二区三区99性 | 亚洲国产精品成人精品无码区在线| 亚洲日韩看片无码电影| 亚洲Av无码精品色午夜 | 免费a级毛片无码a∨蜜芽试看| 国精品无码一区二区三区在线| 无码毛片一区二区三区中文字幕 | 伊人久久无码精品中文字幕| 无码av人妻一区二区三区四区| 亚洲精品无码MV在线观看| 红桃AV一区二区三区在线无码AV| 免费无遮挡无码视频在线观看| 亚洲aⅴ天堂av天堂无码麻豆| 91久久九九无码成人网站| 久久亚洲精品无码AV红樱桃 | 免费看国产成年无码AV片| 亚洲AV永久无码精品网站在线观看| 久久久无码精品亚洲日韩蜜臀浪潮| 亚洲色无码专区在线观看| 中文字幕无码乱人伦| 国产精品无码无需播放器| 亚洲第一极品精品无码久久| 无码国产精品一区二区免费16| 久久亚洲精品无码| 久久久久亚洲AV无码专区首JN|