System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 无码137片内射在线影院,久久久无码精品人妻一区,精品无码AV一区二区三区不卡
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于語音控制的車機(jī)屏自定義喚醒詞配置方法及系統(tǒng)技術(shù)方案

    技術(shù)編號(hào):44499444 閱讀:6 留言:0更新日期:2025-03-04 18:07
    本發(fā)明專利技術(shù)涉及語音識(shí)別技術(shù)領(lǐng)域,公開了基于語音控制的車機(jī)屏自定義喚醒詞配置方法及系統(tǒng),該方法包括:采集目標(biāo)車輛的車內(nèi)噪音數(shù)據(jù),構(gòu)建噪音數(shù)據(jù)庫;將噪音數(shù)據(jù)庫中的噪音記錄劃分為多個(gè)噪音等級(jí);獲取用戶自定義喚醒詞語音樣本,提取自定義喚醒詞聲紋特征向量;度量自定義喚醒詞聲紋特征向量與聲紋特征庫中各聲紋特征向量的相似度,匹配獲得相似度最高的第一聲紋特征;構(gòu)建噪音等級(jí)對應(yīng)的喚醒詞檢測子模型,實(shí)時(shí)采集車內(nèi)音頻數(shù)據(jù),根據(jù)喚醒詞檢測子模型和第一聲紋特征,進(jìn)行喚醒詞識(shí)別,觸發(fā)車機(jī)屏幕喚醒;本發(fā)明專利技術(shù)提高了喚醒詞識(shí)別的準(zhǔn)確性和響應(yīng)速度。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及語音識(shí)別,更具體地說,本專利技術(shù)涉及基于語音控制的車機(jī)屏自定義喚醒詞配置方法及系統(tǒng)


    技術(shù)介紹

    1、隨著人工智能技術(shù)的快速發(fā)展,語音交互已成為人機(jī)交互的重要方式之一。特別是在智能駕駛領(lǐng)域,通過語音指令控制車載設(shè)備,可以最大限度地保證行車安全。車載語音助手能夠在駕駛員將注意力集中在路況的情況下,通過語音交互完成導(dǎo)航、音樂播放、空調(diào)控制等任務(wù)。其中,語音喚醒是實(shí)現(xiàn)車載語音交互的關(guān)鍵一環(huán)。

    2、在現(xiàn)有的車載語音喚醒系統(tǒng)中,主要采用預(yù)設(shè)喚醒詞或用戶自定義喚醒詞的方式觸發(fā)喚醒。例如公開號(hào)為cn113611294a的專利申請公開了一種語音喚醒方法,通過配置多個(gè)組合喚醒詞,當(dāng)用戶語音與組合喚醒詞匹配時(shí)執(zhí)行喚醒。該方法支持預(yù)設(shè)喚醒詞、自定義喚醒詞和多喚醒詞喚醒,但沒有考慮車內(nèi)噪音等復(fù)雜聲學(xué)環(huán)境對喚醒性能的影響。再如授權(quán)公告號(hào)為cn109360552b的專利提出一種自動(dòng)過濾喚醒詞的方法,通過對比用戶語音與喚醒詞音頻,得到用戶語音中的無意義喚醒詞并進(jìn)行屏蔽,從而提高語義解析的準(zhǔn)確率。該方法側(cè)重于喚醒后語義理解階段,但在復(fù)雜聲學(xué)環(huán)境下容易產(chǎn)生誤喚醒。

    3、綜上所述,現(xiàn)有的語音喚醒技術(shù)未充分考慮車內(nèi)噪音對喚醒性能的影響,自定義喚醒詞與用戶聲紋匹配度不足;車內(nèi)噪音具有時(shí)變性和多樣性,喚醒系統(tǒng)需要在各種復(fù)雜噪音環(huán)境下保持穩(wěn)定的喚醒性能,而現(xiàn)有方法普遍缺乏針對車內(nèi)噪音的適配機(jī)制;用戶音色、語速、情緒等因素都會(huì)影響自定義喚醒詞的聲學(xué)特征,若自定義喚醒詞模型與用戶實(shí)際發(fā)音存在較大差異,會(huì)導(dǎo)致喚醒準(zhǔn)確率下降;現(xiàn)有的自定義喚醒詞方法通常只訓(xùn)練一個(gè)統(tǒng)一的聲學(xué)模型,缺乏針對用戶個(gè)性化聲紋特征的建模能力。


    技術(shù)實(shí)現(xiàn)思路

    1、為了克服現(xiàn)有技術(shù)的上述缺陷,本專利技術(shù)提供基于語音控制的車機(jī)屏自定義喚醒詞配置方法及系統(tǒng),該方法首先采集車內(nèi)噪音數(shù)據(jù)構(gòu)建噪音數(shù)據(jù)庫,并將噪音記錄劃分為多個(gè)噪音等級(jí);然后獲取自定義喚醒詞語音樣本,匹配得到用戶聲紋特征;再針對不同噪音等級(jí)構(gòu)建喚醒詞檢測子模型。在喚醒識(shí)別階段,根據(jù)車內(nèi)音頻數(shù)據(jù)所屬的噪音等級(jí),選用對應(yīng)的喚醒詞檢測子模型,同時(shí)結(jié)合用戶聲紋特征進(jìn)行匹配驗(yàn)證,從而在復(fù)雜車內(nèi)噪音環(huán)境下精確識(shí)別自定義喚醒詞,顯著提高喚醒準(zhǔn)確率和系統(tǒng)響應(yīng)速度。

    2、為實(shí)現(xiàn)上述目的,本專利技術(shù)提供如下技術(shù)方案:

    3、基于語音控制的車機(jī)屏自定義喚醒詞配置方法,包括:

    4、采集目標(biāo)車輛的車內(nèi)噪音數(shù)據(jù),構(gòu)建車內(nèi)噪音數(shù)據(jù)庫,所述車內(nèi)噪音數(shù)據(jù)庫包括n1條噪音記錄;將車內(nèi)噪音數(shù)據(jù)庫中的n1條噪音記錄劃分為n1個(gè)噪音等級(jí),記錄每條噪音記錄的噪音等級(jí)標(biāo)簽;獲取用戶的自定義喚醒詞語音樣本,提取自定義喚醒詞語音樣本的聲紋特征向量,標(biāo)記為自定義喚醒詞聲紋特征向量;度量自定義喚醒詞聲紋特征向量與預(yù)構(gòu)建的聲紋特征庫中各聲紋特征向量的相似度,匹配得到與自定義喚醒詞聲紋特征向量相似度最高的第一聲紋特征;

    5、根據(jù)車內(nèi)噪音數(shù)據(jù)庫和第一聲紋特征,構(gòu)建n1個(gè)噪音等級(jí)對應(yīng)的喚醒詞檢測子模型;

    6、實(shí)時(shí)采集車內(nèi)音頻數(shù)據(jù),基于車內(nèi)音頻數(shù)據(jù)、喚醒詞檢測子模型和第一聲紋特征進(jìn)行喚醒詞識(shí)別,觸發(fā)車機(jī)屏幕喚醒。

    7、進(jìn)一步地,所述n1條噪音記錄,每條噪音記錄包括一個(gè)噪音片段的屬性數(shù)據(jù);所述噪音片段的屬性數(shù)據(jù)包括噪音片段編號(hào)、噪音片段數(shù)據(jù)、噪音類型標(biāo)簽、噪音能量值和噪音頻譜特征向量。

    8、所述將車內(nèi)噪音數(shù)據(jù)庫中的n1條噪音記錄劃分為n1個(gè)噪音等級(jí)包括:根據(jù)車內(nèi)噪音數(shù)據(jù)庫中n1條噪音記錄的噪音能量值和噪音頻譜特征向量,對n1條噪音記錄進(jìn)行聚類。

    9、進(jìn)一步地,所述對n1條噪音記錄進(jìn)行聚類包括:

    10、步驟s1210,根據(jù)車內(nèi)噪音數(shù)據(jù)庫中每條噪音記錄的噪音能量值和噪音頻譜特征向量,計(jì)算能量均值ei、頻譜重心fi,和頻譜離散度di,構(gòu)成每條噪音記錄的噪音聲學(xué)特征向量[ei,fi,di];其中,ei為第i條噪音記錄的能量均值,fi為第i條噪音記錄的頻譜重心,di為第i條噪音記錄的頻譜離散度,[ei,fi,di]表示第i條噪音記錄的噪音聲學(xué)特征向量;

    11、步驟s1220,以噪音聲學(xué)特征向量[ei,fi,di]為特征描述,對n1條噪音記錄進(jìn)行聚類,得到n1個(gè)噪音聚類中心;

    12、步驟s1230,計(jì)算平均輪廓系數(shù)sc,若sc≤sc',則調(diào)整噪音聚類中心數(shù)n1,返回步驟s1220重新聚類,直至sc>sc',輸出聚類結(jié)果;sc'為預(yù)設(shè)的輪廓系數(shù)閾值。

    13、進(jìn)一步地,所述聲紋特征庫的構(gòu)建方法為:采集多個(gè)用戶的語音樣本,提取語音樣本的聲紋特征向量,構(gòu)建聲紋特征庫;聲紋特征向量包括基頻、共振峰和語音速率;

    14、所述得到與自定義喚醒詞聲紋特征向量相似度最高的第一聲紋特征包括:

    15、度量自定義喚醒詞聲紋特征向量與聲紋特征庫中各聲紋特征向量的相似度,得到相似度得分;根據(jù)相似度得分排序,選取得分最高的聲紋特征庫中的聲紋特征向量,標(biāo)記為第一聲紋特征。

    16、進(jìn)一步地,所述構(gòu)建n1個(gè)噪音等級(jí)對應(yīng)的喚醒詞檢測子模型包括:

    17、以車內(nèi)噪音數(shù)據(jù)庫中的n1個(gè)噪音等級(jí)為基礎(chǔ),構(gòu)建n1個(gè)噪音數(shù)據(jù)子集,每個(gè)噪音數(shù)據(jù)子集對應(yīng)一個(gè)噪音等級(jí);

    18、遍歷n1個(gè)噪音等級(jí),針對每個(gè)噪音等級(jí),分別構(gòu)建獨(dú)立的喚醒詞檢測子模型;得到所有n1個(gè)噪音等級(jí)對應(yīng)的喚醒詞檢測子模型,所述喚醒詞檢測子模型的輸出為用布爾值表示的自定義喚醒詞檢測結(jié)果,如果為1則表示檢測到自定義喚醒詞,如果為0則表示未檢測到自定義喚醒詞;

    19、所述構(gòu)建n1個(gè)噪音數(shù)據(jù)子集包括:

    20、遍歷車內(nèi)噪音數(shù)據(jù)庫中的n1條噪音記錄,根據(jù)每條噪音記錄的噪音等級(jí)標(biāo)簽,將其劃分至對應(yīng)的n1個(gè)噪音數(shù)據(jù)子集中。

    21、進(jìn)一步地,所述針對每個(gè)噪音等級(jí),分別構(gòu)建獨(dú)立的喚醒詞檢測子模型包括:

    22、根據(jù)預(yù)設(shè)的數(shù)據(jù)集劃分比例,將第j個(gè)噪音數(shù)據(jù)子集劃分為訓(xùn)練集、驗(yàn)證集和測試集;1≤j≤n1;

    23、將第j個(gè)噪音數(shù)據(jù)子集中的訓(xùn)練集與第一聲紋特征進(jìn)行融合,構(gòu)建面向噪音等級(jí)j的喚醒詞檢測訓(xùn)練集;

    24、以面向噪音等級(jí)j的喚醒詞檢測訓(xùn)練集為輸入,訓(xùn)練噪音等級(jí)j下的初始喚醒詞檢測子模型。

    25、進(jìn)一步地,所述基于車內(nèi)音頻數(shù)據(jù)、喚醒詞檢測子模型和第一聲紋特征進(jìn)行喚醒詞識(shí)別,觸發(fā)車機(jī)屏幕喚醒包括:

    26、步驟s3100,判斷車內(nèi)音頻數(shù)據(jù)所屬噪音等級(jí),并選用車內(nèi)音頻數(shù)據(jù)所屬噪音等級(jí)對應(yīng)的喚醒詞檢測子模型進(jìn)行自定義喚醒詞檢測,判斷是否檢測到自定義喚醒詞;

    27、步驟s3200,若未檢測到自定義喚醒詞,則跳轉(zhuǎn)至步驟s3100,繼續(xù)下一輪車內(nèi)音頻數(shù)據(jù)采集與檢測;若檢測到自定義喚醒詞,則通過麥克風(fēng)陣列采集喚醒詞音頻數(shù)據(jù),對喚醒詞說話人進(jìn)行定位,獲得喚醒詞說話人相對車載麥克風(fēng)陣列的水平方位角和距離;

    28、步驟s3300,設(shè)置喚醒角度閾值范圍和距離閾值范圍;若且,則判定檢測到的自定義喚醒詞來自車內(nèi)合理位置,本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述n1條噪音記錄,每條噪音記錄包括一個(gè)噪音片段的屬性數(shù)據(jù);所述噪音片段的屬性數(shù)據(jù)包括噪音片段編號(hào)、噪音片段數(shù)據(jù)、噪音類型標(biāo)簽、噪音能量值和噪音頻譜特征向量;

    3.根據(jù)權(quán)利要求2所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述對n1條噪音記錄進(jìn)行聚類包括:

    4.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述聲紋特征庫的構(gòu)建方法為:采集多個(gè)用戶的語音樣本,提取語音樣本的聲紋特征向量,構(gòu)建聲紋特征庫;聲紋特征向量包括基頻、共振峰和語音速率;

    5.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述構(gòu)建N1個(gè)噪音等級(jí)對應(yīng)的喚醒詞檢測子模型包括:

    6.根據(jù)權(quán)利要求5所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述針對每個(gè)噪音等級(jí),分別構(gòu)建獨(dú)立的喚醒詞檢測子模型包括:

    7.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述基于車內(nèi)音頻數(shù)據(jù)、喚醒詞檢測子模型和第一聲紋特征進(jìn)行喚醒詞識(shí)別,觸發(fā)車機(jī)屏幕喚醒包括:

    8.根據(jù)權(quán)利要求7所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述判斷車內(nèi)音頻數(shù)據(jù)所屬噪音等級(jí)包括:

    9.根據(jù)權(quán)利要求7所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述獲得喚醒詞說話人相對車載麥克風(fēng)陣列的水平方位角和距離包括:

    10.基于語音控制的車機(jī)屏自定義喚醒詞配置系統(tǒng),其用于實(shí)現(xiàn)權(quán)利要求1-9中任一項(xiàng)所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述系統(tǒng)包括:

    ...

    【技術(shù)特征摘要】

    1.基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述n1條噪音記錄,每條噪音記錄包括一個(gè)噪音片段的屬性數(shù)據(jù);所述噪音片段的屬性數(shù)據(jù)包括噪音片段編號(hào)、噪音片段數(shù)據(jù)、噪音類型標(biāo)簽、噪音能量值和噪音頻譜特征向量;

    3.根據(jù)權(quán)利要求2所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述對n1條噪音記錄進(jìn)行聚類包括:

    4.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述聲紋特征庫的構(gòu)建方法為:采集多個(gè)用戶的語音樣本,提取語音樣本的聲紋特征向量,構(gòu)建聲紋特征庫;聲紋特征向量包括基頻、共振峰和語音速率;

    5.根據(jù)權(quán)利要求1所述的基于語音控制的車機(jī)屏自定義喚醒詞配置方法,其特征在于,所述構(gòu)建n1個(gè)噪音等級(jí)對應(yīng)的喚醒詞...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:盛小飛李金許瑋
    申請(專利權(quán))人:辛巴網(wǎng)絡(luò)科技南京有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV日韩AV永久无码久久| 亚洲AV无码专区电影在线观看| 日韩精品人妻系列无码av东京| 内射人妻无套中出无码| 亚洲av无码天堂一区二区三区| 台湾无码一区二区| 免费A级毛片无码A∨男男| 人妻无码久久一区二区三区免费| 成人无码嫩草影院| 亚洲日韩av无码中文| 国产热の有码热の无码视频| 国产成人无码精品一区不卡| 精品人妻系列无码天堂| 久久青草亚洲AV无码麻豆| 亚洲高清无码专区视频| 韩国无码AV片在线观看网站 | 亚洲国产成人精品无码一区二区| 成人h动漫精品一区二区无码| 日韩精品无码久久久久久 | 人妻少妇无码精品视频区| 亚洲av无码专区在线电影 | 亚洲欧洲日产国码无码网站| 国产成人无码精品一区不卡| 久久久久久亚洲av无码蜜芽 | 人妻少妇精品无码专区动漫| 67194成l人在线观看线路无码| 亚洲A∨无码一区二区三区| 亚洲精品色午夜无码专区日韩| 亚洲精品人成无码中文毛片 | 无套内射在线无码播放| 亚洲精品无码MV在线观看| 亚洲中文字幕无码日韩| 国产免费无码一区二区| 亚洲AV无码精品色午夜果冻不卡 | gogo少妇无码肉肉视频| 亚洲国产精品无码久久久久久曰| 永久无码精品三区在线4| 亚洲精品无码专区2| 八戒理论片午影院无码爱恋| 永久免费av无码入口国语片| 无码中文字幕日韩专区|