當(dāng)前位置: 首頁 > 專利查詢>華為技術(shù)有限公司專利>正文

一種語音交互方法、裝置和第一電子設(shè)備制造方法及圖紙

技術(shù)編號(hào)：44510427 閱讀：4 留言：0更新日期：2025-03-07 13:07

本申請(qǐng)實(shí)施例提供了一種語音交互方法、裝置和第一電子設(shè)備。該方法應(yīng)用于第一電子設(shè)備，該方法包括：獲取環(huán)境音信號(hào)；當(dāng)判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)時(shí)，對(duì)聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令；響應(yīng)于語音指令觸發(fā)語音交互；或者，向第二電子設(shè)備發(fā)送語音指令，語音指令用于觸發(fā)第二電子設(shè)備進(jìn)行語音交互。本申請(qǐng)實(shí)施例提供的技術(shù)方案，通過判斷環(huán)境音信號(hào)是否包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)，對(duì)用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)進(jìn)行語音識(shí)別來觸發(fā)語音交互，能夠?qū)崿F(xiàn)近場語音交互場景中對(duì)電子設(shè)備的輕聲免喚醒功能。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

【】本申請(qǐng)涉及電子，尤其涉及一種語音交互方法、裝置和第一電子設(shè)備。

技術(shù)介紹

0、
技術(shù)介紹

1、語音是日常生活中攜帶信息的常用方式，隨著語音技術(shù)的發(fā)展，也出現(xiàn)了越來越多的語音識(shí)別算法來進(jìn)行語音識(shí)別，根據(jù)語音來源距離的不同分為遠(yuǎn)場語音和近場語音，在進(jìn)行語音識(shí)別時(shí)，可以針對(duì)不同的語音來源距離采用不同的語音交互方法來進(jìn)行語音交互，以便獲取到的清晰的、可識(shí)別的語音信息。

2、在近場語音交互場景中，用戶一般通過手動(dòng)點(diǎn)擊電子設(shè)備的喚醒按鍵或者說出特定喚醒詞來觸發(fā)電子設(shè)備的語音交互功能開啟，一般的免喚醒功能采用語音的定向拾取，只能對(duì)電子設(shè)備的某個(gè)角度范圍的聲音進(jìn)行響應(yīng)，不能實(shí)現(xiàn)近場語音交互場景中對(duì)電子設(shè)備的輕聲免喚醒功能。

技術(shù)實(shí)現(xiàn)思路

0、
技術(shù)實(shí)現(xiàn)思路

1、有鑒于此，本申請(qǐng)實(shí)施例提供了一種語音交互方法、裝置和第一電子設(shè)備，用以實(shí)現(xiàn)近場語音交互場景中對(duì)電子設(shè)備的輕聲免喚醒功能。

2、本申請(qǐng)實(shí)施例采用下述技術(shù)方案：

3、第一方面，本申請(qǐng)實(shí)施例提供了一種語音交互方法，該方法應(yīng)用于第一電子設(shè)備，該方法包括：

4、獲取環(huán)境音信號(hào)；

5、當(dāng)判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)時(shí)，對(duì)聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令；

6、響應(yīng)于語音指令觸發(fā)語音交互；或者，向第二電子設(shè)備發(fā)送語音指令，語音指令用于觸發(fā)所述第二電子設(shè)備進(jìn)行語音交互。

7、根據(jù)本申請(qǐng)?zhí)峁┑恼Z音交互方法，通過判斷環(huán)

8、在第一方面的一種實(shí)現(xiàn)方式中，判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)，具體包括：

9、識(shí)別出環(huán)境音信號(hào)對(duì)應(yīng)的一個(gè)或多個(gè)說話人；

10、根據(jù)獲取的拾音模型，生成每個(gè)說話人對(duì)應(yīng)的拾音距離；

11、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí)，則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。

12、在第一方面的一種實(shí)現(xiàn)方式中，判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)，具體包括：

13、根據(jù)環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離；

14、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí)，則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。

15、進(jìn)一步地，當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí)，則判斷出環(huán)境音信號(hào)滿足近場譜分析的條件，能夠根據(jù)說話人的發(fā)聲體與第一電子設(shè)備的距離判斷出當(dāng)前的環(huán)境音信號(hào)中包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)，能夠從多個(gè)說話人中判斷出處于近場語音交互條件的說話人，能夠提高后續(xù)語音識(shí)別的準(zhǔn)確性。

16、在第一方面的一種實(shí)現(xiàn)方式中，根據(jù)環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離，具體包括：

17、根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲壓信息和/或聲速信息；

18、根據(jù)聲速信息，生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離；或者，

19、根據(jù)聲壓信息和聲速信息，生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。

20、進(jìn)一步地，根據(jù)聲壓信息和/或聲速信息能夠準(zhǔn)確得到說話人的拾音距離。

21、在第一方面的一種實(shí)現(xiàn)方式中，對(duì)聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令，具體包括：

22、對(duì)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離中最小的拾音距離對(duì)應(yīng)的聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令。

23、進(jìn)一步地，通過對(duì)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離中最小的拾音距離對(duì)應(yīng)的聲音信號(hào)進(jìn)行語音識(shí)別，能夠準(zhǔn)確得到距離第一電子設(shè)備最近的用戶的聲音信號(hào)，提高了拾音的準(zhǔn)確性。

24、在第一方面的一種實(shí)現(xiàn)方式中，語音指令包括應(yīng)用操作指令或錄音指令。

25、在第一方面的一種實(shí)現(xiàn)方式中，對(duì)聲音信號(hào)進(jìn)行語音識(shí)別之前，還包括：

26、對(duì)環(huán)境音信號(hào)進(jìn)行聲音增強(qiáng)處理，生成聲音信號(hào)。

27、進(jìn)一步地，對(duì)環(huán)境音信號(hào)進(jìn)行聲音增強(qiáng)處理，能夠去除環(huán)境噪聲，提高聲音信號(hào)的質(zhì)量。

28、在第一方面的一種實(shí)現(xiàn)方式中，聲音增強(qiáng)處理包括噪聲抑制處理和/或混響抑制處理。

29、在第一方面的一種實(shí)現(xiàn)方式中，獲取環(huán)境音信號(hào)，具體包括：

30、接收第二電子設(shè)備發(fā)送的環(huán)境音信號(hào)。

31、第二方面，本申請(qǐng)實(shí)施例提供了一種語音交互裝置，該裝置應(yīng)用于第一電子設(shè)備，該裝置包括：

32、麥克風(fēng)模塊，用于獲取環(huán)境音信號(hào)；

33、判斷模塊，用于判斷環(huán)境音信號(hào)是否包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)；

34、語音識(shí)別模塊，用于當(dāng)判斷模塊判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)時(shí)，對(duì)聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令；

35、語音交互模塊，用于響應(yīng)于語音指令觸發(fā)語音交互；或者，無線通信模塊，用于向第二電子設(shè)備發(fā)送語音指令，語音指令用于觸發(fā)第二電子設(shè)備進(jìn)行語音交互。

36、在第二方面的一種實(shí)現(xiàn)方式中，判斷模塊具體用于：

37、識(shí)別出環(huán)境音信號(hào)對(duì)應(yīng)的一個(gè)或多個(gè)說話人；

38、根據(jù)獲取的拾音模型，生成每個(gè)說話人對(duì)應(yīng)的拾音距離；

39、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí)，則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。

40、在第二方面的一種實(shí)現(xiàn)方式中，判斷模塊具體用于：

41、根據(jù)環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離；

42、當(dāng)一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離小于設(shè)定距離閾值時(shí)，則判斷出環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)。

43、在第二方面的一種實(shí)現(xiàn)方式中，判斷模塊具體用于：

44、根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲壓信息和/或聲速信息；

45、根據(jù)聲速信息，生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離；或者，

46、根據(jù)聲壓信息和聲速信息，生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。

47、在第二方面的一種實(shí)現(xiàn)方式中，還包括：

48、當(dāng)麥克風(fēng)模塊中麥克風(fēng)的數(shù)量為一顆時(shí)，麥克風(fēng)為聲速麥克風(fēng)；

49、判斷模塊具體用于根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲速信息；根據(jù)聲速信息生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。

50、在第二方面的一種實(shí)現(xiàn)方式中，還包括：

51、當(dāng)麥克風(fēng)模塊中麥克風(fēng)的數(shù)量為多顆時(shí)，麥克風(fēng)包括一顆聲速麥克風(fēng)和一顆聲壓麥克風(fēng)；

52、判斷模塊具體用于根據(jù)環(huán)境音信號(hào)生成環(huán)境音信號(hào)的聲壓信息和聲速信息；根據(jù)聲壓信息和聲速信息，生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離。

53、在第二方面的一種實(shí)現(xiàn)方式中，麥克風(fēng)處于始終開啟狀態(tài)，以實(shí)時(shí)獲取環(huán)境音信號(hào)。<本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】

1.一種語音交互方法，其特征在于，所述方法應(yīng)用于第一電子設(shè)備，所述方法包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述判斷出所述環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)，具體包括：

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述判斷出所述環(huán)境音信號(hào)包括用戶在設(shè)定距離范圍內(nèi)輸入的聲音信號(hào)，具體包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)所述環(huán)境音信號(hào)生成一個(gè)或多個(gè)說話人對(duì)應(yīng)的拾音距離，具體包括：

5.根據(jù)權(quán)利要求2至4任一項(xiàng)所述的方法，其特征在于，所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令，具體包括：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述語音指令包括應(yīng)用操作指令或錄音指令。

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別之前，還包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述聲音增強(qiáng)處理包括噪聲抑制處理和/或混響抑制處理。

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取環(huán)境音信號(hào)，具體包括：

10.一

11.根據(jù)權(quán)利要求10所述的裝置，其特征在于，所述判斷模塊具體用于：

12.根據(jù)權(quán)利要求10所述的裝置，其特征在于，所述判斷模塊具體用于：

13.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述判斷模塊具體用于：

14.根據(jù)權(quán)利要求13所述的裝置，其特征在于，還包括：

15.根據(jù)權(quán)利要求13所述的裝置，其特征在于，還包括：

16.根據(jù)權(quán)利要求15所述的裝置，其特征在于，所述麥克風(fēng)處于始終開啟狀態(tài)，以實(shí)時(shí)獲取所述環(huán)境音信號(hào)。

17.根據(jù)權(quán)利要求11至13任一項(xiàng)所述的裝置，其特征在于，所述語音識(shí)別模塊具體用于：

18.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序，當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí)，使得計(jì)算機(jī)執(zhí)行如權(quán)利要求1-9中任一項(xiàng)所述的方法。

19.一種第一電子設(shè)備，其特征在于，所述第一電子設(shè)備包括用于存儲(chǔ)計(jì)算機(jī)程序指令的存儲(chǔ)器和用于執(zhí)行計(jì)算機(jī)程序指令的處理器，其中，當(dāng)所述計(jì)算機(jī)程序指令被該處理器執(zhí)行時(shí)，觸發(fā)所述第一電子設(shè)備執(zhí)行如權(quán)利要求1-9中任一項(xiàng)所述的方法步驟。

...

【技術(shù)特征摘要】

1.一種語音交互方法，其特征在于，所述方法應(yīng)用于第一電子設(shè)備，所述方法包括：

5.根據(jù)權(quán)利要求2至4任一項(xiàng)所述的方法，其特征在于，所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別，生成語音指令，具體包括：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述語音指令包括應(yīng)用操作指令或錄音指令。

7.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述對(duì)所述聲音信號(hào)進(jìn)行語音識(shí)別之前，還包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述聲音增強(qiáng)處理包括噪聲抑制處理和/或混響抑制處理。

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取環(huán)境音信號(hào)，具體包括：

10.一種語音交互裝置，其特征在于，應(yīng)用于...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：石超宇，黎椿鍵，羅友，陳家熠，
申請(qǐng)(專利權(quán))人：華為技術(shù)有限公司，
類型：發(fā)明
國別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評(píng)論

還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)