• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    異構解碼網絡的構建方法及系統(tǒng)、語音識別方法及系統(tǒng)技術方案

    技術編號:10472650 閱讀:204 留言:0更新日期:2014-09-25 11:03
    本發(fā)明專利技術公開了一種異構解碼網絡的構建方法及系統(tǒng)、語音識別方法及系統(tǒng),構建方法包括:獲取業(yè)務所需的命令詞解碼網絡和聽寫解碼網絡;構建命令詞訓練數據集和聽寫訓練數據集;利用命令詞訓練數據集和聽寫訓練數據集,確定命令詞解碼網絡的補償得分;優(yōu)化命令詞解碼網絡,并使優(yōu)化后的命令詞解碼網絡的每個弧上保存有命令詞條、補償得分、以及對應命令詞條的聲學模型得分;將優(yōu)化后的命令詞解碼網絡和聽寫解碼網絡并聯組成異構解碼網絡。應用本發(fā)明專利技術實施例異構解碼網絡的構建方法及系統(tǒng),通過配置一套識別引擎完成多種不同業(yè)務的并聯識別、節(jié)省系統(tǒng)資源;應用本發(fā)明專利技術實施例語音識別方法及系統(tǒng),可以提高識別效果及識別效率,降低系統(tǒng)的復雜度。

    【技術實現步驟摘要】
    異構解碼網絡的構建方法及系統(tǒng)、語音識別方法及系統(tǒng)
    本專利技術涉及語音信號處理
    ,尤其涉及一種異構解碼網絡的構建方法及系統(tǒng)、語音識別方法及系統(tǒng)。
    技術介紹
    語音識別技術就是讓機器通過識別和理解過程將語音信號轉變?yōu)橄鄳奈谋净蛎畹募夹g?,F有的語音識別系統(tǒng),通常只能單獨支持命令詞識別(基于規(guī)則的語音識別系統(tǒng))或聽寫識別(基于統(tǒng)計的語音識識別系統(tǒng))。因此,在一些多業(yè)務的場景(比如在車載設備上的應用,既需要命令詞識別,如“打電話給xxx”、“發(fā)短信給xxx”,還需要聽寫識別,如短信的內容,導航的目的地等;再比如手機語音助手上的使用,對于大部分的功能,比如聊天、查天氣、查股票等都是聽寫識別,但是打電話和發(fā)短信功能都是使用的命令詞識別)下,需要同時配置這兩種系統(tǒng),實現多種不同語音業(yè)務的并聯識別?;谝?guī)則的語音識別系統(tǒng)利用命令詞解碼網絡實現解碼,而基于統(tǒng)計的語音識別系統(tǒng)利用聽寫解碼網絡實現解碼。由于這兩種類型的解碼網絡的結構不同,所以針對這兩種類型的解碼網絡需要分別配置不同的識別引擎才能完成識別工作。這種方式不僅會占用大量系統(tǒng)資源,影響系統(tǒng)性能,而且,由于聽寫解碼網絡和命令詞解碼網絡的結構不一致,需要進行置信度判決來選擇最終的識別結果,可靠性差,效率低,而且增加了整個語音識別系統(tǒng)的復雜度。
    技術實現思路
    本專利技術實施例一方面提供了一種異構解碼網絡的構建方法及系統(tǒng),可以在多業(yè)務的場景下,通過配置一套識別引擎完成多種不同業(yè)務的并聯識別、節(jié)省系統(tǒng)資源。本專利技術實施例另一方面提供了一種基于該異構解碼網絡的語音識別方法及系統(tǒng),以提高識別效果及識別效率,降低系統(tǒng)的復雜度。本專利技術實施例提供一種異構解碼網絡的構建方法,包括:獲取業(yè)務所需的命令詞解碼網絡和聽寫解碼網絡,所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分,所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分;構建命令詞訓練數據集和聽寫訓練數據集,所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成,所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成;利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分;優(yōu)化所述命令詞解碼網絡,并使優(yōu)化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分;將優(yōu)化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。優(yōu)選地,所述利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分包括:依次將所述命令詞訓練數據集內的每一個命令詞訓練數據輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述命令詞訓練數據的第一命令詞網絡得分和第一聽寫網絡得分;所述第一命令詞網絡得分為與所述命令詞訓練數據相匹配的命令詞條對應的聲學模型得分,所述第一聽寫網絡得分為與所述命令詞訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和;依次將所述聽寫訓練數據集內的每一個聽寫訓練數據分別輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述聽寫訓練數據的第二命令詞網絡得分和第二聽寫網絡得分,所述第二命令詞網絡得分為與所述聽寫訓練數據相匹配的命令詞條對應的聲學模型得分,所述第二聽寫網絡得分為與所述聽寫訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和;確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件:對于命令詞訓練數據集內的設定比例的命令詞訓練數據,所述第一命令詞網絡得分與所述補償得分之和大于所述第一聽寫網絡得分;對于聽寫訓練數據集內的設定比例的聽寫訓練數據,所述第二命令詞網絡得分與所述補償得分之和小于所述第二聽寫網絡得分。優(yōu)選地,所述確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件包括:獲取滿足第一取值范圍且能夠整除第一步進量的第一參數,以及滿足第二取值范圍且能夠整除第二步進量的第二參數的所有參數組合;依次對每一組參數組合,獲取所述命令詞訓練數據集內滿足第一預設條件的命令詞訓練數據個數,所述第一預設條件為:所述第一參數和所述命令詞訓練數據對應的第一命令詞網絡得分的乘積與所述第二參數的和,大于所述命令詞訓練數據對應的第一聽寫網絡得分;依次對每一組參數組合,獲取所述聽寫訓練數據集內滿足第二預設條件的聽寫訓練數據個數,所述第二預設條件為:所述第一參數和所述聽寫訓練數據對應的第二命令詞網絡得分的乘積與所述第二參數的和,小于所述聽寫訓練數據對應的第二聽寫網絡得分;確定優(yōu)選參數組合,所述優(yōu)選參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和,大于其它參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和;將所述優(yōu)選參數組合中第一參數和任意第一命令詞網絡得分的乘積與所述優(yōu)選參數組合中第二參數的和,再減去所述第一命令詞網絡得分所得的結果,作為所述命令詞解碼網絡的補償得分。優(yōu)選地,所述確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件包括:獲取滿足設定的取值范圍且能夠整除設定的步進量的參數集合;依次對所述參數集合中的每一個參數,獲取所述命令詞訓練數據集內滿足第三預設條件的命令詞訓練數據個數,所述第三預設條件為:所述命令詞訓練數據對應的第一命令詞網絡得分與所述參數的和,大于所述命令詞訓練數據對應的第一聽寫網絡得分;依次對所述參數集合中的每一個參數,獲取所述聽寫訓練數據集內滿足第四預設條件的聽寫訓練數據個數,所述第四預設條件為:所述聽寫訓練數據對應的第二命令詞網絡得分與所述參數的和,小于所述聽寫訓練數據對應的第二聽寫網絡得分;確定優(yōu)選參數,所述優(yōu)選參數對應的命令詞訓練數據個數和聽寫訓練數據個數之和,大于其它參數對應的命令詞訓練數據個數和聽寫訓練數據個數之和;將所述優(yōu)選參數作為所述命令詞解碼網絡補償得分。本專利技術實施例還提供一種異構解碼網絡的構建系統(tǒng),包括:解碼網絡獲取單元,用于獲取業(yè)務所需的命令詞解碼網絡和聽寫解碼網絡,所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分,所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分;訓練數據集構建單元,用于構建命令詞訓練數據集和聽寫訓練數據集,所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成,所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成;補償得分確定單元,用于利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分;優(yōu)化單元,用于優(yōu)化所述命令詞解碼網絡,并使優(yōu)化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分;并聯單元,用于將優(yōu)化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。優(yōu)選地,所述補償得分確定單元包括:第一網絡得分獲取單元,用于依次將所述命令詞訓練數據集內的每一個命令詞訓練數據輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述命令詞訓練數據的第一命令詞網絡得分和第一聽寫網絡得分;所述第一命令詞網絡得分為與所述命令詞訓練數據相匹配的命令詞條對應的聲學模型得分,所述第一聽寫網絡得分為與所述命令詞訓練數據相匹配的聽寫詞條對應的聲學模型本文檔來自技高網...
    異構解碼網絡的構建方法及系統(tǒng)、語音識別方法及系統(tǒng)

    【技術保護點】
    一種異構解碼網絡的構建方法,其特征在于,包括:獲取業(yè)務所需的命令詞解碼網絡和聽寫解碼網絡,所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分,所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分;構建命令詞訓練數據集和聽寫訓練數據集,所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成,所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成;利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分;優(yōu)化所述命令詞解碼網絡,并使優(yōu)化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分;將優(yōu)化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。

    【技術特征摘要】
    1.一種異構解碼網絡的構建方法,其特征在于,包括:獲取業(yè)務所需的命令詞解碼網絡和聽寫解碼網絡,所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分,所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分;構建命令詞訓練數據集和聽寫訓練數據集,所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成,所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成;利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分;優(yōu)化所述命令詞解碼網絡,并使優(yōu)化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分;將優(yōu)化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。2.根據權利要求1所述的方法,其特征在于,所述利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分包括:依次將所述命令詞訓練數據集內的每一個命令詞訓練數據輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述命令詞訓練數據的第一命令詞網絡得分和第一聽寫網絡得分;所述第一命令詞網絡得分為與所述命令詞訓練數據相匹配的命令詞條對應的聲學模型得分,所述第一聽寫網絡得分為與所述命令詞訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和;依次將所述聽寫訓練數據集內的每一個聽寫訓練數據分別輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述聽寫訓練數據的第二命令詞網絡得分和第二聽寫網絡得分,所述第二命令詞網絡得分為與所述聽寫訓練數據相匹配的命令詞條對應的聲學模型得分,所述第二聽寫網絡得分為與所述聽寫訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和;確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件:對于命令詞訓練數據集內的設定比例的命令詞訓練數據,所述第一命令詞網絡得分與所述補償得分之和大于所述第一聽寫網絡得分;對于聽寫訓練數據集內的設定比例的聽寫訓練數據,所述第二命令詞網絡得分與所述補償得分之和小于所述第二聽寫網絡得分。3.根據權利要求2所述的方法,其特征在于,所述確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件包括:獲取滿足第一取值范圍且能夠整除第一步進量的第一參數,以及滿足第二取值范圍且能夠整除第二步進量的第二參數的所有參數組合;依次對每一組參數組合,獲取所述命令詞訓練數據集內滿足第一預設條件的命令詞訓練數據個數,所述第一預設條件為:所述第一參數和所述命令詞訓練數據對應的第一命令詞網絡得分的乘積與所述第二參數的和,大于所述命令詞訓練數據對應的第一聽寫網絡得分;依次對每一組參數組合,獲取所述聽寫訓練數據集內滿足第二預設條件的聽寫訓練數據個數,所述第二預設條件為:所述第一參數和所述聽寫訓練數據對應的第二命令詞網絡得分的乘積與所述第二參數的和,小于所述聽寫訓練數據對應的第二聽寫網絡得分;確定優(yōu)選參數組合,所述優(yōu)選參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和,大于其它參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和;將所述優(yōu)選參數組合中第一參數和任意第一命令詞網絡得分的乘積與所述優(yōu)選參數組合中第二參數的和,再減去所述第一命令詞網絡得分所得的結果,作為所述命令詞解碼網絡的補償得分。4.根據權利要求2所述的方法,其特征在于,所述確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件包括:獲取滿足設定的取值范圍且能夠整除設定的步進量的參數集合;依次對所述參數集合中的每一個參數,獲取所述命令詞訓練數據集內滿足第三預設條件的命令詞訓練數據個數,所述第三預設條件為:所述命令詞訓練數據對應的第一命令詞網絡得分與所述參數的和,大于所述命令詞訓練數據對應的第一聽寫網絡得分;依次對所述參數集合中的每一個參數,獲取所述聽寫訓練數據集內滿足第四預設條件的聽寫訓練數據個數,所述第四預設條件為:所述聽寫訓練數據對應的第二命令詞網絡得分與所述參數的和,小于所述聽寫訓練數據對應的第二聽寫網絡得分;確定優(yōu)選參數,所述優(yōu)選參數對應的命令詞訓練數據個數和聽寫訓練數據個數之和,大于其它參數對應的命令詞訓練數據個數和聽寫訓練數據個數之和;將所述優(yōu)選參數作為所述命令詞解碼網絡補償得分。5.一種異構解碼網絡的構建系統(tǒng),其特征在于,包括:解碼網絡獲取單元,用于獲取業(yè)務所需的命令詞解碼網絡和聽寫解碼網絡,所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分,所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分;訓練數據集構建單元,用于構建命令詞訓練數據集和聽寫訓練數據集,所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成,所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成;補償得分確定單元,用于利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分;優(yōu)化單元,用于優(yōu)化所述命令詞解碼網絡,并使優(yōu)化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分;并聯單元,用于將優(yōu)化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。...

    【專利技術屬性】
    技術研發(fā)人員:鹿曉亮單言豐劉強,
    申請(專利權)人:科大訊飛股份有限公司,
    類型:發(fā)明
    國別省市:安徽;34

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 熟妇人妻系列aⅴ无码专区友真希| 久久无码专区国产精品| 少妇极品熟妇人妻无码| 精品国产AV无码一区二区三区| 亚洲男人第一无码aⅴ网站| 亚洲AV无码精品无码麻豆| 国产怡春院无码一区二区| 亚洲v国产v天堂a无码久久| 小13箩利洗澡无码视频网站| 日韩AV片无码一区二区不卡| 人妻aⅴ无码一区二区三区| 中文字幕无码久久精品青草| 无码粉嫩虎白一线天在线观看| 国产aⅴ无码专区亚洲av| 人妻无码中文字幕免费视频蜜桃| 99久久国产热无码精品免费| 亚洲精品无码精品mV在线观看| 丰满少妇被猛烈进入无码| 色情无码WWW视频无码区小黄鸭 | 久久久人妻精品无码一区| 日韩精品人妻系列无码专区免费| 日韩久久无码免费毛片软件| 亚洲日韩看片无码电影| 无码人妻视频一区二区三区| 中文有无人妻vs无码人妻激烈| 免费无码又黄又爽又刺激| 中文午夜人妻无码看片| 无码AV天堂一区二区三区| 亚洲一区AV无码少妇电影☆| 自拍中文精品无码| 中国少妇无码专区| 中文无码vs无码人妻 | 无码丰满少妇2在线观看| 中文字幕日韩精品无码内射| yy111111少妇影院无码| 免费无码专区毛片高潮喷水| 在线无码视频观看草草视频| 白嫩无码人妻丰满熟妇啪啪区百度| 少妇无码AV无码专区线| 日韩毛片无码永久免费看| 无码国产69精品久久久久孕妇|