【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及語(yǔ)音信號(hào)處理
,具體涉及一種語(yǔ)音識(shí)別文本處理方法及系統(tǒng)。
技術(shù)介紹
隨著語(yǔ)音技術(shù)的發(fā)展,自動(dòng)語(yǔ)音識(shí)別技術(shù)已經(jīng)被廣泛地應(yīng)用于生產(chǎn)、生活的各個(gè)領(lǐng)域,構(gòu)造出各種實(shí)用的語(yǔ)音識(shí)別系統(tǒng),如語(yǔ)音會(huì)議轉(zhuǎn)寫系統(tǒng)等。然而,在實(shí)際的識(shí)別文本中,經(jīng)常會(huì)存在各種異常語(yǔ)音數(shù)據(jù)的識(shí)別文本,因此不可避免地會(huì)產(chǎn)生一些異常識(shí)別文本。由于異常語(yǔ)音數(shù)據(jù)的識(shí)別文本可懂度較低,經(jīng)常會(huì)使用戶無(wú)法理解識(shí)別文本所表達(dá)的語(yǔ)義,給用戶造成干擾,甚至誤導(dǎo)用戶,如異常語(yǔ)音數(shù)據(jù)為“九幺零九后邊再隔一家”,識(shí)別文本為“九幺零九后面的可以去”。因此,如何減輕異常語(yǔ)音識(shí)別文本對(duì)用戶的干擾,是業(yè)界需要解決的一個(gè)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)提供一種語(yǔ)音識(shí)別文本處理方法及系統(tǒng),以自動(dòng)檢測(cè)出異常語(yǔ)音數(shù)據(jù)的識(shí)別文本并標(biāo)記出來(lái),提示用戶,降低對(duì)用戶的誤導(dǎo)。為此,本專利技術(shù)提供如下技術(shù)方案:一種語(yǔ)音識(shí)別文本處理方法,包括:獲取待識(shí)別語(yǔ)音數(shù)據(jù);對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音識(shí)別結(jié)果,所述語(yǔ)音識(shí)別結(jié)果為語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別文本;對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行異常語(yǔ)音檢測(cè),以確定所述語(yǔ)音數(shù)據(jù)中的異常語(yǔ)音;對(duì)所述識(shí)別文本中對(duì)應(yīng)所述異常語(yǔ)音的部分進(jìn)行標(biāo)記;將標(biāo)記后的識(shí)別文本提供給用戶。優(yōu)選地,所述根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行異常語(yǔ)音檢測(cè),得到異常語(yǔ)音檢測(cè)結(jié)果包括:依次獲取所述語(yǔ)音數(shù)據(jù)中的待檢測(cè)語(yǔ)音片段;根據(jù)語(yǔ)音識(shí)別結(jié)果計(jì)算所述待檢測(cè)語(yǔ)音片段的后驗(yàn)概率和/或置信度;基于所述后驗(yàn)概率和/或置信度確定所述待檢測(cè)語(yǔ)音片段是否為異常語(yǔ)音。優(yōu)選地,所述根據(jù)語(yǔ)音識(shí)別結(jié)果計(jì)算所述待檢測(cè)語(yǔ)音片段的后驗(yàn)概率包括:根據(jù)語(yǔ)音識(shí)別時(shí) ...
【技術(shù)保護(hù)點(diǎn)】
一種語(yǔ)音識(shí)別文本處理方法,其特征在于,包括:獲取待識(shí)別語(yǔ)音數(shù)據(jù);對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音識(shí)別結(jié)果,所述語(yǔ)音識(shí)別結(jié)果為語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別文本;對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行異常語(yǔ)音檢測(cè),以確定所述語(yǔ)音數(shù)據(jù)中的異常語(yǔ)音;對(duì)所述識(shí)別文本中對(duì)應(yīng)所述異常語(yǔ)音的部分進(jìn)行標(biāo)記;將標(biāo)記后的識(shí)別文本提供給用戶。
【技術(shù)特征摘要】
1.一種語(yǔ)音識(shí)別文本處理方法,其特征在于,包括:獲取待識(shí)別語(yǔ)音數(shù)據(jù);對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音識(shí)別結(jié)果,所述語(yǔ)音識(shí)別結(jié)果為語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的識(shí)別文本;對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行異常語(yǔ)音檢測(cè),以確定所述語(yǔ)音數(shù)據(jù)中的異常語(yǔ)音;對(duì)所述識(shí)別文本中對(duì)應(yīng)所述異常語(yǔ)音的部分進(jìn)行標(biāo)記;將標(biāo)記后的識(shí)別文本提供給用戶。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行異常語(yǔ)音檢測(cè),得到異常語(yǔ)音檢測(cè)結(jié)果包括:依次獲取所述語(yǔ)音數(shù)據(jù)中的待檢測(cè)語(yǔ)音片段;根據(jù)語(yǔ)音識(shí)別結(jié)果計(jì)算所述待檢測(cè)語(yǔ)音片段的后驗(yàn)概率和/或置信度;基于所述后驗(yàn)概率和/或置信度確定所述待檢測(cè)語(yǔ)音片段是否為異常語(yǔ)音。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)語(yǔ)音識(shí)別結(jié)果計(jì)算所述待檢測(cè)語(yǔ)音片段的后驗(yàn)概率包括:根據(jù)語(yǔ)音識(shí)別時(shí)的解碼路徑,確定當(dāng)前待檢測(cè)語(yǔ)音片段對(duì)應(yīng)的各語(yǔ)法單元;計(jì)算各語(yǔ)法單元每幀語(yǔ)音數(shù)據(jù)的后驗(yàn)概率;將當(dāng)前待檢測(cè)語(yǔ)音片段對(duì)應(yīng)的所有語(yǔ)法單元每幀語(yǔ)音數(shù)據(jù)的后驗(yàn)概率進(jìn)行融合處理,得到當(dāng)前待檢測(cè)語(yǔ)音片段的后驗(yàn)概率;所述根據(jù)語(yǔ)音識(shí)別結(jié)果計(jì)算所述待檢測(cè)語(yǔ)音片段的置信度包括:提取所述待檢測(cè)語(yǔ)音片段的檢測(cè)特征,所述檢測(cè)特征包括:所述待檢測(cè)語(yǔ)音片段的識(shí)別特征;或者所述檢測(cè)特征包括:待檢測(cè)語(yǔ)音片段的識(shí)別特征、以及所述待檢測(cè)語(yǔ)音片段對(duì)應(yīng)的識(shí)別文本的語(yǔ)義特征;或者所述檢測(cè)特征包括:待檢測(cè)語(yǔ)音片段的識(shí)別特征、所述待檢測(cè)語(yǔ)音片段對(duì)應(yīng)的識(shí)別文本的語(yǔ)義特征、以及所述待檢測(cè)語(yǔ)音片段的后驗(yàn)概率;根據(jù)所述檢測(cè)特征計(jì)算所述待檢測(cè)語(yǔ)音數(shù)據(jù)的置信度;所述基于所述后驗(yàn)概率和/或置信度確定所述待檢測(cè)語(yǔ)音片段是否為異常語(yǔ)音包括:如果當(dāng)前待檢測(cè)語(yǔ)音片段的后驗(yàn)概率和/或置信度小于設(shè)定的閾值,則確定當(dāng)前待檢測(cè)語(yǔ)音片段為異常語(yǔ)音。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述后驗(yàn)概率包括:狀態(tài)后驗(yàn)概率、和/或?qū)傩院篁?yàn)概率。5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:在對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別之前,依次獲取所述語(yǔ)音數(shù)據(jù)中的待檢測(cè)語(yǔ)音片段;如果當(dāng)前待檢測(cè)語(yǔ)音片段滿足設(shè)定的異常語(yǔ)音確定規(guī)則,則在對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別后,不再對(duì)所述當(dāng)前待檢測(cè)語(yǔ)音片段進(jìn)行異常語(yǔ)音檢測(cè),而是直接將所述當(dāng)前待檢測(cè)語(yǔ)音片段作為異常語(yǔ)音。6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述對(duì)所述識(shí)別文本中對(duì)應(yīng)所述異常語(yǔ)音的部分進(jìn)行標(biāo)記包括以下任意一種或多種:對(duì)所述異常語(yǔ)音的識(shí)別文本添加下劃線、或刪除線;將所述異常語(yǔ)音的識(shí)別文本調(diào)整為與其它識(shí)別文本不同的顏色和/或字體;將所述異常語(yǔ)音的識(shí)別文本調(diào)整為漸變色;使用多侯選的方式顯示異常語(yǔ)音的識(shí)別文本。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:在用戶點(diǎn)擊有標(biāo)記的識(shí)別文本時(shí),彈出帶有提示信息的消息框、或氣泡、或包含提示信息的圖片。8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括:將所述提示信息合成語(yǔ)音,并播放所述語(yǔ)音給用戶。9.一種語(yǔ)音識(shí)別文本處理系統(tǒng),其特征在于,包括:接收模塊,用于獲取待識(shí)別語(yǔ)音數(shù)據(jù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:占吉清,高建清,劉聰,王智國(guó),胡國(guó)平,胡郁,劉慶峰,
申請(qǐng)(專利權(quán))人:科大訊飛股份有限公司,
類型:發(fā)明
國(guó)別省市:安徽;34
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。