本申請實(shí)施例公開了一種指令控制方法和系統(tǒng),該方法包括:當(dāng)檢測到針對預(yù)設(shè)按鍵的觸控喚醒操作時(shí),根據(jù)所述觸控喚醒操作控制麥克風(fēng)開始采集語音指令;確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),并根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距離最近的聲源的位置;根據(jù)每個(gè)聲源對應(yīng)的語音指令,對與該聲源所在位置匹配的目標(biāo)設(shè)備進(jìn)行控制。通過該實(shí)施例方案,消除了語音指令誤喚醒的困擾,避免了車內(nèi)多人語音造成識別混亂,能夠?qū)崿F(xiàn)同時(shí)執(zhí)行多個(gè)語音指令。執(zhí)行多個(gè)語音指令。執(zhí)行多個(gè)語音指令。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種指令控制方法和系統(tǒng)
[0001]本申請實(shí)施例涉及車輛控制技術(shù),尤指一種指令控制方法和系統(tǒng)。
技術(shù)介紹
[0002]目前車輛具備多音區(qū)啟動(dòng)語音識別功能,大多采用免喚醒或語音指令啟動(dòng),會(huì)產(chǎn)生誤喚醒的困擾,并且可能對于車內(nèi)其他人員造成干擾和尷尬局面。目前的喚醒語音按鍵僅限于駕駛員,乘客使用體驗(yàn)不佳,車內(nèi)語音定位系統(tǒng)單純依靠聲音識別。另外,目前主要是通過讓駕駛員帶耳機(jī)進(jìn)行降噪,使得車載系統(tǒng)可以更準(zhǔn)確地收集駕駛員的語音指令,大幅度境地了用戶體驗(yàn)。而且目前的語音指令控制系統(tǒng)是不支持多個(gè)語音指令并行執(zhí)行的。
技術(shù)實(shí)現(xiàn)思路
[0003]本申請實(shí)施例提供了一種指令控制方法和系統(tǒng),能夠消除語音指令誤喚醒的困擾,避免車內(nèi)多人語音造成識別混亂,同時(shí)執(zhí)行多個(gè)語音指令。
[0004]本申請實(shí)施例提供了一種指令控制方法,所述方法可以包括:
[0005]當(dāng)檢測到針對預(yù)設(shè)按鍵的觸控喚醒操作時(shí),根據(jù)所述觸控喚醒操作控制麥克風(fēng)開始采集語音指令;
[0006]確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),并根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距離最近的聲源的位置;
[0007]根據(jù)每個(gè)聲源對應(yīng)的語音指令,對與該聲源所在位置匹配的目標(biāo)設(shè)備進(jìn)行控制。
[0008]在本申請的示例性實(shí)施例中,所述確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),可以包括:
[0009]檢測被喚醒的麥克風(fēng)的數(shù)量;
[0010]當(dāng)被喚醒的麥克風(fēng)的數(shù)量為一個(gè)時(shí),將被喚醒的該麥克風(fēng)作為與所述語音指令的聲源距離最近的麥克風(fēng);
[0011]當(dāng)被喚醒的麥克風(fēng)的數(shù)量為多個(gè)時(shí),檢測每個(gè)麥克風(fēng)接收到的語音指令的數(shù)量,根據(jù)接收到的語音指令的數(shù)量不同和/或語音指令的不同分別執(zhí)行相應(yīng)的策略,以確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng)。
[0012]在本申請的示例性實(shí)施例中,所述根據(jù)接收到的語音指令的數(shù)量不同和/或語音指令的不同分別執(zhí)行相應(yīng)的策略,以確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),可以包括:
[0013]當(dāng)每個(gè)麥克風(fēng)均接收到一個(gè)語音指令,且每個(gè)麥克風(fēng)接收到的語音指令均為同一個(gè)語音指令時(shí),執(zhí)行預(yù)設(shè)的第一策略確定出與所述語音指令的聲源距離最近的麥克風(fēng);
[0014]當(dāng)每個(gè)麥克風(fēng)均接收到一個(gè)語音指令,且至少兩個(gè)麥克風(fēng)接收到的語音指令不是同一個(gè)語音指令時(shí),針對接收到不同語音指令的麥克風(fēng),執(zhí)行下述的第二策略:將接收到不同語音指令的麥克風(fēng)分別作為與該麥克風(fēng)所接收到的語音指令的聲源距離最近的麥克風(fēng);針對接收到相同語音指令的麥克風(fēng),執(zhí)行所述第一策略。
[0015]當(dāng)至少一個(gè)麥克風(fēng)接收到多個(gè)語音指令時(shí),針對每一個(gè)麥克風(fēng),從該麥克風(fēng)接收到的全部語音指令中確定出其聲源與該麥克風(fēng)距離最近的語音指令;檢測確定出的其聲源與該麥克風(fēng)距離最近的語音指令是否被多個(gè)麥克風(fēng)接收到,當(dāng)檢測到該語音指令僅被一個(gè)麥克風(fēng)接收到時(shí),將該麥克風(fēng)作為與該語音指令的聲源距離最近的麥克風(fēng);當(dāng)檢測到該語音指令被多個(gè)麥克風(fēng)接收到時(shí),采用所述第一策略確定出與該語音指令的聲源距離最近的麥克風(fēng)。
[0016]在本申請的示例性實(shí)施例中,所述第一策略可以包括:
[0017]計(jì)算每個(gè)麥克風(fēng)從開始采集語音指令到接收到所述語音指令的間隔時(shí)長,比較多個(gè)不同的麥克風(fēng)對應(yīng)的間隔時(shí)長的大小,將對應(yīng)的間隔時(shí)長最小的麥克風(fēng)作為與所述語音指令的聲源距離最近的麥克風(fēng);和/或,
[0018]計(jì)算每個(gè)麥克風(fēng)采集到的語音指令的語音強(qiáng)度,比較多個(gè)不同的麥克風(fēng)對應(yīng)的語音強(qiáng)度的大小,將對應(yīng)的語音強(qiáng)度最大的麥克風(fēng)作為與所述語音指令的聲源距離最近的麥克風(fēng)。
[0019]在本申請的示例性實(shí)施例中,所述根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距離最近的聲源的位置,可以包括:
[0020]獲取采集到的與該麥克風(fēng)距離最近的聲源對應(yīng)的語音指令的語音信息;所述語音信息包括以下任意一種或多種:延時(shí)信息、頻率信息、強(qiáng)度信息和衰減信息;
[0021]根據(jù)所述語音信息計(jì)算所述麥克風(fēng)與所述聲源的距離,記為第一距離,并根據(jù)所述語音信息識別所述聲源相對于所述麥克風(fēng)的方位;
[0022]以所述麥克風(fēng)的位置為原點(diǎn),在所述方位上確定出到所述原點(diǎn)的距離為所述第一距離的位置作為所述聲源的位置。
[0023]在本申請的示例性實(shí)施例中,所述根據(jù)每個(gè)聲源對應(yīng)的語音指令,對與該聲源所在位置匹配的目標(biāo)設(shè)備進(jìn)行控制,可以包括:
[0024]從所述語音指令的語音內(nèi)容中解析出所要控制的受控設(shè)備作為目標(biāo)設(shè)備,并解析出所述目標(biāo)設(shè)備所需完成的操作;
[0025]根據(jù)所述聲源的位置確定出與所述聲源相匹配的目標(biāo)設(shè)備,并控制該目標(biāo)設(shè)備執(zhí)行所需完成的操作。
[0026]在本申請的示例性實(shí)施例中,在確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng)之前,所述方法還可以包括:
[0027]對采集到的所述語音指令進(jìn)行語音內(nèi)容識別;
[0028]對識別出的語音內(nèi)容進(jìn)行播報(bào);
[0029]根據(jù)對所述播報(bào)的反饋確定語音內(nèi)容識別是否成功;
[0030]當(dāng)確定語音內(nèi)容識別成功時(shí),開始確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng)。
[0031]在本申請的示例性實(shí)施例中,在根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距離最近的聲源的位置之前,所述方法還可以包括:
[0032]根據(jù)所述預(yù)設(shè)按鍵的位置驗(yàn)證確定出的所述麥克風(fēng)的位置是否準(zhǔn)確;
[0033]其中,當(dāng)所述預(yù)設(shè)按鍵的位置與確定出的所述麥克風(fēng)的位置之間的距離小于或等于第二預(yù)設(shè)距離閾值,和/或所述預(yù)設(shè)按鍵的位置與確定出的所述麥克風(fēng)的位置相對于車
輛上的預(yù)設(shè)參考位置在同一方位時(shí),判定確定出的所述麥克風(fēng)的位置準(zhǔn)確;當(dāng)所述預(yù)設(shè)按鍵的位置與確定出的所述麥克風(fēng)的位置之間的距離大于所述第二預(yù)設(shè)距離閾值,且所述預(yù)設(shè)按鍵的位置與確定出的所述麥克風(fēng)的位置相對于車輛上的預(yù)設(shè)參考位置不在同一方位時(shí),判定確定出的所述麥克風(fēng)的位置不準(zhǔn)確。
[0034]本申請實(shí)施例還提供了一種指令控制系統(tǒng),可以包括:預(yù)設(shè)按鍵、麥克風(fēng)、揚(yáng)聲器和麥克風(fēng)控制器;其中,所述預(yù)設(shè)按鍵、所述麥克風(fēng)、所述揚(yáng)聲器以及受控設(shè)備均與所述麥克風(fēng)控制器相連;
[0035]所述麥克風(fēng)控制器包括處理器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有指令,當(dāng)所述指令被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)所述的指令控制方法。
[0036]在本申請的示例性實(shí)施例中,所述預(yù)設(shè)按鍵可以包括:車窗按鍵;所述受控設(shè)備包括以下任意一種或多種:座椅、空調(diào)、揚(yáng)聲器和后視鏡。
[0037]與相關(guān)技術(shù)相比,本申請實(shí)施例可以包括:當(dāng)檢測到針對預(yù)設(shè)按鍵的觸控喚醒操作時(shí),根據(jù)所述觸控喚醒操作控制麥克風(fēng)開始采集語音指令;確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),并根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距離最近的聲源的位置;根據(jù)每個(gè)聲源對應(yīng)的語音指令,對與該聲源所在位置匹配的目標(biāo)設(shè)備進(jìn)行控制。通過該實(shí)施例方案,消除了語音指令誤喚醒的困擾,避免了車內(nèi)多人語音造成識別混本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種指令控制方法,其特征在于,所述方法包括:當(dāng)檢測到針對預(yù)設(shè)按鍵的觸控喚醒操作時(shí),根據(jù)所述觸控喚醒操作控制麥克風(fēng)開始采集語音指令;確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),并根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距離最近的聲源的位置;根據(jù)每個(gè)聲源對應(yīng)的語音指令,對與該聲源所在位置匹配的目標(biāo)設(shè)備進(jìn)行控制。2.根據(jù)權(quán)利要求1所述的指令控制方法,其特征在于,所述確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),包括:檢測被喚醒的麥克風(fēng)的數(shù)量;當(dāng)被喚醒的麥克風(fēng)的數(shù)量為一個(gè)時(shí),將被喚醒的該麥克風(fēng)作為與所述語音指令的聲源距離最近的麥克風(fēng);當(dāng)被喚醒的麥克風(fēng)的數(shù)量為多個(gè)時(shí),檢測每個(gè)麥克風(fēng)接收到的語音指令的數(shù)量,根據(jù)接收到的語音指令的數(shù)量不同和/或語音指令的不同分別執(zhí)行相應(yīng)的策略,以確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng)。3.根據(jù)權(quán)利要求2所述的指令控制方法,其特征在于,所述根據(jù)接收到的語音指令的數(shù)量不同和/或語音指令的不同分別執(zhí)行相應(yīng)的策略,以確定與所采集的每個(gè)語音指令的聲源距離最近的麥克風(fēng),包括:當(dāng)每個(gè)麥克風(fēng)均接收到一個(gè)語音指令,且每個(gè)麥克風(fēng)接收到的語音指令均為同一個(gè)語音指令時(shí),執(zhí)行預(yù)設(shè)的第一策略確定出與所述語音指令的聲源距離最近的麥克風(fēng);當(dāng)每個(gè)麥克風(fēng)均接收到一個(gè)語音指令,且至少兩個(gè)麥克風(fēng)接收到的語音指令不是同一個(gè)語音指令時(shí),針對接收到不同語音指令的麥克風(fēng),執(zhí)行下述的第二策略:將接收到不同語音指令的麥克風(fēng)分別作為與該麥克風(fēng)所接收到的語音指令的聲源距離最近的麥克風(fēng);針對接收到相同語音指令的麥克風(fēng),執(zhí)行所述第一策略;當(dāng)至少一個(gè)麥克風(fēng)接收到多個(gè)語音指令時(shí),針對每一個(gè)麥克風(fēng),從該麥克風(fēng)接收到的全部語音指令中確定出其聲源與該麥克風(fēng)距離最近的語音指令;檢測確定出的其聲源與該麥克風(fēng)距離最近的語音指令是否被多個(gè)麥克風(fēng)接收到,當(dāng)檢測到該語音指令僅被一個(gè)麥克風(fēng)接收到時(shí),將該麥克風(fēng)作為與該語音指令的聲源距離最近的麥克風(fēng);當(dāng)檢測到該語音指令被多個(gè)麥克風(fēng)接收到時(shí),采用所述第一策略確定出與該語音指令的聲源距離最近的麥克風(fēng)。4.根據(jù)權(quán)利要求3所述的指令控制方法,其特征在于,所述第一策略包括:計(jì)算每個(gè)麥克風(fēng)從開始采集語音指令到接收到所述語音指令的間隔時(shí)長,比較多個(gè)不同的麥克風(fēng)對應(yīng)的間隔時(shí)長的大小,將對應(yīng)的間隔時(shí)長最小的麥克風(fēng)作為與所述語音指令的聲源距離最近的麥克風(fēng);和/或,計(jì)算每個(gè)麥克風(fēng)采集到的語音指令的語音強(qiáng)度,比較多個(gè)不同的麥克風(fēng)對應(yīng)的語音強(qiáng)度的大小,將對應(yīng)的語音強(qiáng)度最大的麥克風(fēng)作為與所述語音指令的聲源距離最近的麥克風(fēng)。5.根據(jù)權(quán)利要求1
?
4任意一項(xiàng)所述的指令控制方法,其特征在于,在根據(jù)確定出的麥克風(fēng)的位置計(jì)算與該麥克風(fēng)距...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:郭芷銘,馬然,施喆晗,
申請(專利權(quán))人:寧波吉利汽車研究開發(fā)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。