本申請(qǐng)公開(kāi)了一種語(yǔ)音重放檢測(cè)方法和裝置,包括:根據(jù)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型;計(jì)算待識(shí)別語(yǔ)音在所述用戶信道模型上的信任度打分;若所述信任度打分小于設(shè)定閾值,則認(rèn)定待識(shí)別語(yǔ)音存在重放,返回認(rèn)證失敗;反之,通過(guò)重放檢測(cè)。從而解決了現(xiàn)有說(shuō)話人識(shí)別技術(shù)中語(yǔ)音重放攻擊的問(wèn)題。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)?jiān)O(shè)及計(jì)算機(jī)信息服務(wù)
,特別是設(shè)及一種語(yǔ)音重放檢測(cè)方法和裝 置。
技術(shù)介紹
說(shuō)話人識(shí)別技術(shù),又稱為聲紋識(shí)別技術(shù),主要是基于語(yǔ)音中說(shuō)話人包含的個(gè)性特 征的信息,利用計(jì)算機(jī)W及各種信息識(shí)別技術(shù),自動(dòng)地實(shí)現(xiàn)說(shuō)話人身份的確認(rèn)。 近幾年來(lái),隨著互聯(lián)網(wǎng)的飛速發(fā)展,語(yǔ)音作為一種非接觸性信息載體,人們可W依 靠各種移動(dòng)終端設(shè)備,例如:手機(jī)、麥克風(fēng)和IP電話等,隨時(shí)隨地的完成語(yǔ)音采集,并通過(guò)網(wǎng) 絡(luò)傳輸和后臺(tái)服務(wù)器來(lái)實(shí)現(xiàn)人機(jī)交互和說(shuō)話人身份識(shí)別。 隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),在給予人類(lèi)方便快捷的同時(shí),也帶來(lái)了許多安全隱 患。如圖1所示,若說(shuō)話人A的語(yǔ)音被企圖闖入者預(yù)先竊取并錄制,繼而將錄制的語(yǔ)音重新播 放至說(shuō)話人識(shí)別系統(tǒng),說(shuō)話人識(shí)別系統(tǒng)通常將難W區(qū)分,從而導(dǎo)致企圖闖入者成功地W說(shuō) 話人A的錄音闖入說(shuō)話人A的賬號(hào),對(duì)說(shuō)話人A的賬號(hào)帶來(lái)極大的安全隱患。
技術(shù)實(shí)現(xiàn)思路
本申請(qǐng)?zhí)峁┮环N錄音重放檢測(cè)方法和裝置,W解決說(shuō)話人識(shí)別技術(shù)中語(yǔ)音重放的 問(wèn)題。 為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種語(yǔ)音重放檢測(cè)方法,包括: 依據(jù)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型;[000引計(jì)算待識(shí)別語(yǔ)音在所述用戶信道模型上的信任度打分,獲得待識(shí)別語(yǔ)音的信任度 打分; 若所述信任度打分小于設(shè)定闊值,則認(rèn)定待識(shí)別語(yǔ)音存在重放,返回認(rèn)證失敗;反 之,通過(guò)重放檢測(cè)。 優(yōu)選地,依據(jù)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型的步驟包括: 提取目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音的低能量語(yǔ)音段; 若低能量語(yǔ)音段的時(shí)間長(zhǎng)度小于設(shè)定闊值,則依據(jù)信道通用背景模型自適應(yīng)獲取 用戶信道模型;反之,則采用最大期望算法直接獲取用戶信道模型。 優(yōu)選地,所述提取目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音的低能量語(yǔ)音段的步驟之前還包括: 計(jì)算當(dāng)前預(yù)留訓(xùn)練語(yǔ)音段的采樣值的平方和得到當(dāng)前預(yù)留訓(xùn)練語(yǔ)音段的能量,若 所述能量低于設(shè)定闊值,則認(rèn)定為低能量語(yǔ)音段。 優(yōu)選地,依據(jù)信道通用背景模型自適應(yīng)獲取用戶信道模型的步驟包括: 提取目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音的低能量段的多復(fù)合聲學(xué)特征; 依據(jù)最大后驗(yàn)概率估計(jì)算法,利用所述低能量訓(xùn)練語(yǔ)音數(shù)據(jù)的多復(fù)合特征對(duì)所述 信道通用背景模型進(jìn)行模型自適應(yīng)更新,得到用戶信道模型。 優(yōu)選地,所述提取所述低能量語(yǔ)音段的多復(fù)合聲學(xué)特征的步驟包括: 提取低能量語(yǔ)音段的多類(lèi)語(yǔ)音聲學(xué)特征,并拼接成高維度聲學(xué)特征; 使用主成分分析PCA對(duì)高維度聲學(xué)特征進(jìn)行處理,獲得正交化的聲學(xué)特征; 使用線性判別分析LDA對(duì)正交化后的聲學(xué)特征進(jìn)行處理,獲得低維度聲學(xué)特征,將 所述低維度聲學(xué)特征作為多復(fù)合聲學(xué)特征。 優(yōu)選地,訓(xùn)練所述信道通用背景模型的步驟包括: 獲取系統(tǒng)開(kāi)發(fā)集語(yǔ)音數(shù)據(jù)的多復(fù)合聲學(xué)特征; 計(jì)算多復(fù)合聲學(xué)特征中每一帖聲學(xué)特征在信道通用背景模型上的后驗(yàn)概率; 通過(guò)最大期望算法計(jì)算模型參數(shù)的極值,使其在多復(fù)合聲學(xué)特征上的總體概率最 大; 通過(guò)最大期望算法反復(fù)迭代使模型參數(shù)不斷更新,直到得到收斂的模型參數(shù)值, 將所述收斂的模型參數(shù)值對(duì)應(yīng)的模型作為信道通用背景模型。 優(yōu)選地,計(jì)算待識(shí)別語(yǔ)音在目標(biāo)用戶信道模型上的信任度打分的步驟包括: 提取待識(shí)別語(yǔ)音的低能量段的多復(fù)合聲學(xué)特征; 計(jì)算每一帖多復(fù)合聲學(xué)特征在目標(biāo)用戶信道模型上的概率似然分; 計(jì)算全部概率似然分的平均值作為待識(shí)別語(yǔ)音的信任度打分。 為了解決上述問(wèn)題,本申請(qǐng)還公開(kāi)了一種語(yǔ)音重放檢測(cè)裝置,包括: 用戶信道模塊,用于依據(jù)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型; 計(jì)算模塊,用于計(jì)算待識(shí)別語(yǔ)音在目標(biāo)用戶信道模型上的信任度打分,獲得待識(shí) 別語(yǔ)音的信任度打分; 第一判斷模塊,用于若所述信任度打分小于設(shè)定闊值,則認(rèn)定待識(shí)別語(yǔ)音存在重 放,返回認(rèn)證失敗;反之,通過(guò)重放檢測(cè)。 優(yōu)選地,用戶信道模塊包括: 第一提取模塊,用于提取目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音的低能量語(yǔ)音段; 多復(fù)合聲學(xué)特征模塊,用于提取所述低能量語(yǔ)音段的多復(fù)合聲學(xué)特征; 第二判斷模塊,用于若低能量語(yǔ)音段的時(shí)間長(zhǎng)度小于設(shè)定闊值,則依據(jù)信道通用 背景模型自適應(yīng)獲取用戶信道模型;反之,則采用最大期望算法直接獲取用戶信道模型。 優(yōu)選地,第一提取模塊之前還包括:第=判斷模塊,用于計(jì)算當(dāng)前預(yù)留訓(xùn)練語(yǔ)音段 的采樣值的平方和得到當(dāng)前預(yù)留訓(xùn)練語(yǔ)音段的能量,若所述能量低于設(shè)定闊值,則認(rèn)定為 低能量語(yǔ)音段。 與現(xiàn)有技術(shù)相比,本申請(qǐng)包括W下優(yōu)點(diǎn): 本申請(qǐng)通過(guò)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型,依據(jù)用戶信道模型計(jì)算 待識(shí)別語(yǔ)音的信任度打分,將信任度打分與設(shè)定的闊值比較,若信任度打分小于設(shè)定闊值, 則認(rèn)定待識(shí)別語(yǔ)音存在重放,返回待識(shí)別語(yǔ)音認(rèn)證失敗,反之,則通過(guò)重放檢測(cè),即待識(shí)別 語(yǔ)音認(rèn)證成功,通過(guò)計(jì)算待識(shí)別語(yǔ)音在所述用戶信道模型上的信任度打分,,從而避免了闖 入者重放攻擊的問(wèn)題。【附圖說(shuō)明】 圖1是本申請(qǐng)錄音重放應(yīng)用場(chǎng)景的示意圖; 圖2是本申請(qǐng)實(shí)施例一所述一種語(yǔ)音重放檢測(cè)方法的流程圖; 圖3是本申請(qǐng)語(yǔ)音數(shù)據(jù)在錄音前后的時(shí)域圖; 圖4是本申請(qǐng)語(yǔ)音數(shù)據(jù)在錄音前后的頻域圖; 圖5是本申請(qǐng)實(shí)施例二所述一種語(yǔ)音重放檢測(cè)方法的流程圖; 圖6是本申請(qǐng)一種語(yǔ)音重放檢測(cè)方法應(yīng)用的實(shí)例; 圖7是本申請(qǐng)實(shí)施例=所述一種語(yǔ)音重放檢測(cè)裝置的結(jié)構(gòu)框圖。【具體實(shí)施方式】 為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。 實(shí)施例一 參照?qǐng)D2,示出了本申請(qǐng)實(shí)施例一所述一種語(yǔ)音重放檢測(cè)方法的流程圖,具體包 括: 步驟201:依據(jù)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型。 預(yù)先獲取目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音,根據(jù)獲取的目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用 戶信道模型。 可W通過(guò)從后臺(tái)服務(wù)器或者目標(biāo)用戶的客戶端獲取預(yù)留訓(xùn)練語(yǔ)音,也可W采用其 他方式獲取預(yù)留訓(xùn)練語(yǔ)音,對(duì)此本申請(qǐng)不做具體限制。 步驟202:計(jì)算待識(shí)別語(yǔ)音在所述用戶信道模型上的信任度打分。 本申請(qǐng)使用用戶信道模型對(duì)用戶端輸入的待識(shí)別語(yǔ)音進(jìn)行信任度打分,獲取待識(shí) 別語(yǔ)音的信任度打分,根據(jù)信任度打分判斷輸入的待識(shí)別語(yǔ)音是否存在重放。[0057當(dāng)前第1頁(yè)1 2 3 4 本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種語(yǔ)音重放檢測(cè)方法,其特征在于,包括:依據(jù)目標(biāo)用戶的預(yù)留訓(xùn)練語(yǔ)音建立用戶信道模型;計(jì)算待識(shí)別語(yǔ)音在所述用戶信道模型上的信任度打分,獲得待識(shí)別語(yǔ)音的信任度打分;若所述信任度打分小于設(shè)定閾值,則認(rèn)定待識(shí)別語(yǔ)音存在重放,返回認(rèn)證失敗;反之,通過(guò)重放檢測(cè)。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:鄭方,李藍(lán)天,鄔曉鈞,王小鋼,劉樂(lè),
申請(qǐng)(專利權(quán))人:清華大學(xué),北京得意音通技術(shù)有限責(zé)任公司,
類(lèi)型:發(fā)明
國(guó)別省市:北京;11
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。