System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
【】本申請(qǐng)涉及電子,尤其涉及一種語音交互方法、裝置和第一電子設(shè)備。
技術(shù)介紹
0、
技術(shù)介紹
1、語音是日常生活中攜帶信息的常用方式,隨著語音技術(shù)的發(fā)展,也出現(xiàn)了越來越多的語音識(shí)別算法來進(jìn)行語音識(shí)別,根據(jù)語音來源距離的不同分為遠(yuǎn)場語音和近場語音,在進(jìn)行語音識(shí)別時(shí),可以針對(duì)不同的語音來源距離采用不同的語音交互方法來進(jìn)行語音交互,以便獲取到的清晰的、可識(shí)別的語音信息。
2、在近場語音交互場景中,用戶一般通過手動(dòng)點(diǎn)擊電子設(shè)備的喚醒按鍵或者說出特定喚醒詞來觸發(fā)電子設(shè)備的語音交互功能開啟,一般的免喚醒功能采用語音的定向拾取,只能對(duì)電子設(shè)備的某個(gè)角度范圍的聲音進(jìn)行響應(yīng),不能實(shí)現(xiàn)近場語音交互場景中對(duì)電子設(shè)備的輕聲免喚醒功能。
技術(shù)實(shí)現(xiàn)思路
0、
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請(qǐng)實(shí)施例提供了一種語音交互方法、裝置和第一電子設(shè)備,用以實(shí)現(xiàn)近場語音交互場景中對(duì)電子設(shè)備的輕聲免喚醒功能。
2、本申請(qǐng)實(shí)施例采用下述技術(shù)方案:
3、第一方面,本申請(qǐng)實(shí)施例提供了一種語音交互方法,該方法應(yīng)用于第一電子設(shè)備,該方法包括:
4、獲取環(huán)境音信號(hào);
5、當(dāng)判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)時(shí),對(duì)聲音信號(hào)進(jìn)行語音識(shí)別,生成語音指令;
6、響應(yīng)于語音指令觸發(fā)語音交互;或者,向第二電子設(shè)備發(fā)送語音指令,語音指令用于觸發(fā)所述第二電子設(shè)備進(jìn)行語音交互。
7、根據(jù)本申請(qǐng)?zhí)峁┑恼Z音交互方法,通過判斷環(huán)
8、在第一方面的一種實(shí)現(xiàn)方式中,判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),具體包括:
9、識(shí)別出環(huán)境音信號(hào)對(duì)應(yīng)的一個(gè)或多個(gè)說話人;
10、根據(jù)獲取的拾音模型,生成每個(gè)說話人對(duì)應(yīng)的拾音距離;
11、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí),則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。
12、在第一方面的一種實(shí)現(xiàn)方式中,判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),具體包括:
13、根據(jù)環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離;
14、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí),則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。
15、進(jìn)一步地,當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí),則判斷出環(huán)境音信號(hào)滿足近場譜分析的條件,能夠根據(jù)說話人的發(fā)聲體與第一電子設(shè)備的距離判斷出當(dāng)前的環(huán)境音信號(hào)中包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),能夠從多個(gè)說話人中判斷出處于近場語音交互條件的說話人,能夠提高后續(xù)語音識(shí)別的準(zhǔn)確性。
16、在第一方面的一種實(shí)現(xiàn)方式中,根據(jù)環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離,具體包括:
17、根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲壓信息和/或聲速信息;
18、根據(jù)聲速信息,生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離;或者,
19、根據(jù)聲壓信息和聲速信息,生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。
20、進(jìn)一步地,根據(jù)聲壓信息和/或聲速信息能夠準(zhǔn)確得到說話人的拾音距離。
21、在第一方面的一種實(shí)現(xiàn)方式中,對(duì)聲音信號(hào)進(jìn)行語音識(shí)別,生成語音指令,具體包括:
22、對(duì)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離中最小的拾音距離對(duì)應(yīng)的聲音信號(hào)進(jìn)行語音識(shí)別,生成語音指令。
23、進(jìn)一步地,通過對(duì)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離中最小的拾音距離對(duì)應(yīng)的聲音信號(hào)進(jìn)行語音識(shí)別,能夠準(zhǔn)確得到距離第一電子設(shè)備最近的用戶的聲音信號(hào),提高了拾音的準(zhǔn)確性。
24、在第一方面的一種實(shí)現(xiàn)方式中,語音指令包括應(yīng)用操作指令或錄音指令。
25、在第一方面的一種實(shí)現(xiàn)方式中,對(duì)聲音信號(hào)進(jìn)行語音識(shí)別之前,還包括:
26、對(duì)環(huán)境音信號(hào)進(jìn)行聲音增強(qiáng)處理,生成聲音信號(hào)。
27、進(jìn)一步地,對(duì)環(huán)境音信號(hào)進(jìn)行聲音增強(qiáng)處理,能夠去除環(huán)境噪聲,提高聲音信號(hào)的質(zhì)量。
28、在第一方面的一種實(shí)現(xiàn)方式中,聲音增強(qiáng)處理包括噪聲抑制處理和/或混響抑制處理。
29、在第一方面的一種實(shí)現(xiàn)方式中,獲取環(huán)境音信號(hào),具體包括:
30、接收第二電子設(shè)備發(fā)送的環(huán)境音信號(hào)。
31、第二方面,本申請(qǐng)實(shí)施例提供了一種語音交互裝置,該裝置應(yīng)用于第一電子設(shè)備,該裝置包括:
32、麥克風(fēng)模塊,用于獲取環(huán)境音信號(hào);
33、判斷模塊,用于判斷環(huán)境音信號(hào)是否包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào);
34、語音識(shí)別模塊,用于當(dāng)判斷模塊判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)時(shí),對(duì)聲音信號(hào)進(jìn)行語音識(shí)別,生成語音指令;
35、語音交互模塊,用于響應(yīng)于語音指令觸發(fā)語音交互;或者,無線通信模塊,用于向第二電子設(shè)備發(fā)送語音指令,語音指令用于觸發(fā)第二電子設(shè)備進(jìn)行語音交互。
36、在第二方面的一種實(shí)現(xiàn)方式中,判斷模塊具體用于:
37、識(shí)別出環(huán)境音信號(hào)對(duì)應(yīng)的一個(gè)或多個(gè)說話人;
38、根據(jù)獲取的拾音模型,生成每個(gè)說話人對(duì)應(yīng)的拾音距離;
39、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí),則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。
40、在第二方面的一種實(shí)現(xiàn)方式中,判斷模塊具體用于:
41、根據(jù)環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離;
42、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí),則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。
43、在第二方面的一種實(shí)現(xiàn)方式中,判斷模塊具體用于:
44、根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲壓信息和/或聲速信息;
45、根據(jù)聲速信息,生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離;或者,
46、根據(jù)聲壓信息和聲速信息,生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。
47、在第二方面的一種實(shí)現(xiàn)方式中,還包括:
48、當(dāng)麥克風(fēng)模塊中麥克風(fēng)的數(shù)量為一顆時(shí),麥克風(fēng)為聲速麥克風(fēng);
49、判斷模塊具體用于根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲速信息;根據(jù)聲速信息生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。
50、在第二方面的一種實(shí)現(xiàn)方式中,還包括:
51、當(dāng)麥克風(fēng)模塊中麥克風(fēng)的數(shù)量為多顆時(shí),麥克風(fēng)包括一顆聲速麥克風(fēng)和一顆聲壓麥克風(fēng);
52、判斷模塊具體用于根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲壓信息和聲速信息;根據(jù)聲壓信息和聲速信息,生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。
53、在第二方面的一種實(shí)現(xiàn)方式中,麥克風(fēng)處于始終開啟狀態(tài),以實(shí)時(shí)獲取環(huán)境音信號(hào)。<本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種語音交互方法,其特征在于,所述方法應(yīng)用于第一電子設(shè)備,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷出所述環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),具體包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷出所述環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),具體包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離,具體包括:
5.根據(jù)權(quán)利要求2至4任一項(xiàng)所述的方法,其特征在于,所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別,生成語音指令,具體包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音指令包括應(yīng)用操作指令或錄音指令。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別之前,還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述聲音增強(qiáng)處理包括噪聲抑制處理和/或混響抑制處理。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取環(huán)境音信號(hào),具體包括:
10.一
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述判斷模塊具體用于:
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述判斷模塊具體用于:
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述判斷模塊具體用于:
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,還包括:
15.根據(jù)權(quán)利要求13所述的裝置,其特征在于,還包括:
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述麥克風(fēng)處于始終開啟狀態(tài),以實(shí)時(shí)獲取所述環(huán)境音信號(hào)。
17.根據(jù)權(quán)利要求11至13任一項(xiàng)所述的裝置,其特征在于,所述語音識(shí)別模塊具體用于:
18.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行如權(quán)利要求1-9中任一項(xiàng)所述的方法。
19.一種第一電子設(shè)備,其特征在于,所述第一電子設(shè)備包括用于存儲(chǔ)計(jì)算機(jī)程序指令的存儲(chǔ)器和用于執(zhí)行計(jì)算機(jī)程序指令的處理器,其中,當(dāng)所述計(jì)算機(jī)程序指令被該處理器執(zhí)行時(shí),觸發(fā)所述第一電子設(shè)備執(zhí)行如權(quán)利要求1-9中任一項(xiàng)所述的方法步驟。
...【技術(shù)特征摘要】
1.一種語音交互方法,其特征在于,所述方法應(yīng)用于第一電子設(shè)備,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷出所述環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),具體包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷出所述環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào),具體包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離,具體包括:
5.根據(jù)權(quán)利要求2至4任一項(xiàng)所述的方法,其特征在于,所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別,生成語音指令,具體包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音指令包括應(yīng)用操作指令或錄音指令。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別之前,還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述聲音增強(qiáng)處理包括噪聲抑制處理和/或混響抑制處理。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取環(huán)境音信號(hào),具體包括:
10.一種語音交互裝置,其特征在于,應(yīng)用于...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:石超宇,黎椿鍵,羅友,陳家熠,
申請(qǐng)(專利權(quán))人:華為技術(shù)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。