The embodiment of the invention discloses a method and a device for correction of speech recognition, the method comprises: according to the current application scenarios of user's data set to determine the detection of detection equipment; to detect the current scenario of voice recognition; the current application scenarios corresponding to deep learning model speech recognition based on the data of deep learning, learning results; corrected according to the study results of speech recognition results. The embodiment of the invention can meet the specific application scenarios of speech recognition, targeted speech recognition on various scenarios, greatly enhance the accuracy of speech recognition, and then promote the man-machine interaction, can be widely used.
【技術實現步驟摘要】
一種語音識別的校正方法及裝置
本專利技術涉及語音處理技術,尤其涉及一種語音識別的校正方法及裝置。
技術介紹
隨著科技的發展,人類已進入人工智能時代,人工智能用于延展人類的智慧和能力,模擬人類的思維過程和智能行為,使機器能夠勝任通常需要人類智能才能完成的復雜工作。人工智能的其中一個重要分支包括語音識別、文字翻譯以及語音合成,語音識別技術是機器通過識別和理解過程把輸入的語音信號轉變成相應的文本,實現人與機器的交流;文字翻譯技術是將語音識別到的詞語按照正確的語法翻譯為語句;語音合成技術(TexttoSpeech,簡稱TTS)是將機器產生或外部輸入的文字信息轉變為類似人類表達方式的語音并輸出。目前,科大訊飛、微軟、谷歌等公司研制出的語音識別技術是基于具有龐大的云數據處理能力的大數據平臺計算而來,數據量具有大而廣的特點,可以基本實現人機語言交互,但是,針對特定應用場景下的特定應用語句的識別和翻譯往往是不夠準確的?,F有技術的校正方法中,通常采用統計學或機器學習的方法,逐步過濾獲取校正集合。但是這種方法由于缺乏針對性,對每個用戶的輸入進行校正的過程基本是相同的,因此校正的準確性不高。例如,接收到不同用戶的語音“lihua”,通過初始識別獲取的對應文本為“李華”,可能通通校正為“梨花”、“理化”或者“禮花”,即沒有根據不同的應用場景更具有針對性的獲取校正結果。
技術實現思路
本專利技術實施例提供一種語音識別的校正方法及裝置,以解決現有技術中對語音識別結果校正不準確的問題。第一方面,本專利技術實施例提供了一種語音識別的校正方法,包括:根據設定檢測設備的檢測數據確定用戶所處的當前 ...
【技術保護點】
一種語音識別的校正方法,其特征在于,包括:根據設定檢測設備的檢測數據確定用戶所處的當前應用場景;在所述當前應用場景下對檢測到的聲音進行語音識別;基于所述當前應用場景對應的深度學習模型對語音識別得到的語料進行深度學習,獲取學習結果;根據所述學習結果對語音識別的結果進行校正。
【技術特征摘要】
1.一種語音識別的校正方法,其特征在于,包括:根據設定檢測設備的檢測數據確定用戶所處的當前應用場景;在所述當前應用場景下對檢測到的聲音進行語音識別;基于所述當前應用場景對應的深度學習模型對語音識別得到的語料進行深度學習,獲取學習結果;根據所述學習結果對語音識別的結果進行校正。2.根據權利要求1所述的方法,其特征在于,所述根據設定檢測設備的檢測數據確定用戶所處的當前應用場景,包括以下的至少一種:對檢測到的聲音進行語音識別,判斷語音識別得到語料所屬的語料集對應的應用場景;通過定位模塊檢測移動終端所在的位置,獲取用戶所處的當前應用場景;通過藍牙數字信號處理設備檢測應用場景的特征,根據所述特征確定當前應用場景。3.根據權利要求1所述的方法,其特征在于,所述根據設定檢測設備的檢測數據確定用戶所處的當前應用場景之前,還包括:使用聚類算法對各個應用場景下的語料庫進行分組,根據所述分組的結果提取語料特征;對所述語料特征進行訓練,創建對應各個應用場景的深度學習模型。4.根據權利要求1所述的方法,其特征在于,所述根據所述學習結果對語音識別的結果進行校正,包括:如果所述學習結果為所述語音識別的結果與當前應用場景不匹配,將所述語音識別的結果校正為當前應用場景下對應的結果。5.根據權利要求3所述的方法,其特征在于,所述語料庫包括:已存儲的用戶輸入的語料、經過篩選的語料和/或校正語音識別的結果得到的語料。6.一種語音識...
【專利技術屬性】
技術研發人員:石日儉,賀磊,劉旭,呂曉霞,
申請(專利權)人:深圳市大乘科技股份有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。