中文人名自動語音辨識輸入方法及系統技術方案

技術編號：3045708 閱讀：334 留言：0更新日期：2012-04-11 18:40

本發明專利技術涉及一種中文人名自動語音辨識輸入方法，該方法包含：（ａ）由一使用者輸入一第一語音，以描述所欲辨識的一人名，該人名包含多個字符；（ｂ）利用一全人名辨識網絡單元，對該第一語音進行辨識，以得到一人名辨識結果；（ｃ）傳送該人名辨識結果至一字符確認單元；（ｄ）利用該字符確認單元對該人名辨識結果的各該字符分別進行確認；（ｅ）若于步驟（ｄ）中確認各該字符辨識正確，則輸出確認后的該人名辨識結果；（ｆ）若于步驟（ｄ）中確認各該字符其中之一辨識錯誤，則該使用者以一型態輸入一第二語音描述該辨識錯誤字符；（ｇ）利用對應該型態的一描述辨識單元對該第二語音進行辨識，且將其辨識結果傳送至該字符確認單元等。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及一種自動語音辨識輸入方法及系統，尤其涉及一種中文人名自動語音辨識輸入方法及系統。
技術介紹
隨著自動語音辨識技術日漸成熟，提供使用自動語音辨識技術的自動化程序，用以解決慣常繁瑣的例行性工作，便可以達到節省巨額人力支出成本的效果。舉例來說，目前全國性的查號臺(例如104和105)，是使用人工辨識的方式進行人名查詢的辨識工作，并無提供自動語音辨識的輸入法，而提供104查號臺服務的中國電信，則必須使用上千名人力才能應付龐大的查詢需求，若能將其服務功能自動化，則不管是節省人力成本方面，甚或是對人力資源做更妥善的運用安排，都能收到顯著的成效。現行的中文人名自動語音辨識系統，所采取的方式皆以一個個中文人名作為詞組單位訓練語言模型，當使用者以語音輸入進行人名辨識時，辨識引擎會參考使用中文人名所訓練出的語言模型進行比對，待辨識完成后系統即可輸出完整的中文人名。然而，此種中文人名自動語音辨識系統卻只適用于小量(約幾千個人名數據)的中文人名辨識上，一旦遇上大量的人名數據(幾萬個甚至到幾百萬個人名數據)，辨識成功率就會急遽下降，因此現行的中文人名自動語音辨識系統僅適用于一般公司行號的總機系統，若要應用在全國性的查號系統上，由于使用者的耐心有限，恐怕無法忍受辨識率極低的系統，因此在施行上仍有一定的困難度。因此，申請人鑒于公知技術的缺陷，乃經悉心試驗與研究，終于研發出一種中文人名自動語音辨識輸入方法及系統。
技術實現思路
本專利技術的主要構想為提供一種中文人名自動語音辨識輸入方法，其步驟包含(a)由一使用者輸入一第一語音，以描述所欲辨識的一人名，該人名包含多個字符；(...

【技術保護點】
一種中文人名自動語音辨識輸入方法，其步驟包含：（ａ）由一使用者輸入一第一語音，以描述所欲辨識的一人名，該人名包含多個字符；（ｂ）利用一全人名辨識網絡單元，對該第一語音進行辨識，以得到一人名辨識結果；（ｃ）傳送該人名辨識結果至一字符確認單元；（ｄ）利用該字符確認單元對該人名辨識結果的各該字符分別進行確認；（ｅ）若于步驟（ｄ）中確認各該字符辨識正確，則輸出確認后的該人名辨識結果；（ｆ）若于步驟（ｄ）中確認各該字符其中之一辨識錯誤，則該使用者以一型態輸入一第二語音描述該辨識錯誤字符；（ｇ）利用對應該型態的一描述辨識單元對該第二語音進行辨識，且將其辨識結果傳送至該字符確認單元；以及（ｈ）重復步驟（ｄ）－（ｇ）。

【技術特征摘要】
1.一種中文人名自動語音辨識輸入方法，其步驟包含(a)由一使用者輸入一第一語音，以描述所欲辨識的一人名，該人名包含多個字符；(b)利用一全人名辨識網絡單元，對該第一語音進行辨識，以得到一人名辨識結果；(c)傳送該人名辨識結果至一字符確認單元；(d)利用該字符確認單元對該人名辨識結果的各該字符分別進行確認；(e)若于步驟(d)中確認各該字符辨識正確，則輸出確認后的該人名辨識結果；(f)若于步驟(d)中確認各該字符其中之一辨識錯誤，則該使用者以一型態輸入一第二語音描述該辨識錯誤字符；(g)利用對應該型態的一描述辨識單元對該第二語音進行辨識，且將其辨識結果傳送至該字符確認單元；以及(h)重復步驟(d)-(g)。2.根據權利要求1所述的方法，其中步驟(b)還包含下列步驟(b1)獲取該第一語音的一特征參數；以及(b2)依據該特征參數，利用該全人名辨識網絡單元對該第一語音進行辨識，其中步驟(b1)可還包含下列步驟(b11)對該第一語音進行預處理；以及(b12)獲取該第一語音的該特征參數，其中步驟(b11)可還包含下列步驟放大該第一語音信號；對該第一語音信號正規化；對該第一語音信號進行預強調；將該第一語音乘上漢明窗；以及將該第一語音通過一低通濾波器或一高通濾波器，而其中步驟(b12)可還包含下列步驟對該第一語音進行快速傅立葉變換處理；以及求取該第一語音的梅爾倒頻譜參數。3.根據權利要求1所述的方法，其中步驟(d)還包含下列步驟逐一輸出相對于各該字符的多個字符假設；以及由該使用者從該多個字符假設中選擇正確的各該字符，其中；該輸出是以語音播放各該字符假設的一描述詞句，或是以屏幕顯示各該字符假設；及/或該使用者是以語音輸入選擇或是以按鍵輸入選擇。4.根據權利要求1所述的方法，其中步驟(g)還包含下列步驟(g1)獲取該第二語音的一特征參數；以及(g2)依據該特征參數，利用該描述辨識單元對該第二語音進行辨識，其中步驟(g1)還包含下列步驟(g11)對該第二語音進行預處理；以及(g12)獲取該第二語音的該特征參數，其中步驟(g11)可還包含下列步驟放大該第二語音信號；對該第二語音信號正規化；對該第二語音信號進行預強調；將該第二語音乘上漢明窗；以及將該第二語音通過一低通濾波器或一高通濾波器，而其中步驟(g12)可還包含下列步驟對該第二語音進行快速傅立葉變換處理；以及求取該第二語音的梅爾倒頻譜參數。5.根據權利要求1所述的方法，其中步驟(f)中，該使用者是以一字符詞組型態描述該辨識錯誤字符，其中對應該字符詞組型態的描述辨識單元為一字符描述辨識單元。6.根據權利要求1所述的方法，其中步驟(f)中，該使用者是以一音節詞組方式描述該辨識錯誤字符，其中對應該音節詞組型態的描述辨識單元為一音節描述辨識單元。7.一種中文人名自動語音辨識輸入系統，其包含一語音輸入裝置，其用以使一使用者輸入一語音，該語音用以描述所欲辨識的一人名，該人名包含多個字符；一...

【專利技術屬性】
技術研發人員：王瑞璋，蔡錦和，黃良聲，沈家麟，
申請(專利權)人：臺達電子工業股份有限公司，
類型：發明
國別省市：71[中國|臺灣]

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術

語音識別輸入軟件技術

語音識別輸入技術