• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    用于高效且精確譯碼的增量言語譯碼器組合制造技術

    技術編號:14062455 閱讀:437 留言:0更新日期:2016-11-27 23:48
    一種增量語言識別系統。該增量語言識別系統僅當額外的言語譯碼器很可能對組合結果增加顯著益處時才使用額外的言語譯碼器對所講言語進行增量地譯碼。基于精度、性能、多樣性和其它因素對可用的言語譯碼器按系列進行定序。識別管理引擎協調言語譯碼器系列對所講言語的譯碼,組合譯碼后言語,以及判定額外的處理是否可能顯著地改善識別結果,如果是,則識別管理引擎接合下一言語譯碼器且循環繼續。如果精度不能得到顯著改善,則結果被接受,譯碼停止。因此,精度接近該系列的最大值的譯碼后言語被獲得,而不使用系列中的全部言語譯碼器對所講言語進行譯碼,從而最小化資源使用。

    【技術實現步驟摘要】
    【國外來華專利技術】
    技術介紹
    離線(即,非實時)語言識別系統用于不要求對所講言語進行同時回應的方案中。使用離線語言識別的示例包括生成無監督訓練數據用于語言和聲音建模、音頻檢索以及自動語言郵件轉錄。在沒有實時約束的情況下,存在傳遞所講言語通過多個言語譯碼器從而降低識別錯誤率的選擇;然而,必須仍考慮資源成本。當每個所講言語由遠少于全部可用的離線言語譯碼器的多個離線言語譯碼器進行處理時,在計算力、存儲、時間和其它資源方面的要求迅速變得重要。因此,甚至對于離線語言識別,必須針對使用附加系統獲得識別錯誤率降低的益處來衡量成本。正是針對這些以及其它考慮,做出了本專利技術。雖然已經論述了相對具體的問題,應當理解,本文公開的實施例不應限于解決在
    技術介紹
    中提到的具體問題。
    技術實現思路
    提供該概述以便以下文在詳述部分中進一步描述的簡化形式來引入構思的選擇。該概述不意在確定權利要求主題的關鍵特征或主要特征,也不意在該概述用作確定權利要求主題的范圍的輔助。僅當額外的言語譯碼器很可能對組合結果增加顯著的益處時,增量語言識別系統的實施例才使用下一言語譯碼器對所講言語進行增量地譯碼。基于精度、性能、多樣性和其它因素在系列中對多個言語譯碼器進行排序。識別管理引擎通過言語譯碼器系列協調所講言語的增量譯碼,組合譯碼后言語,并且判定額外的處理是否很可能顯著地改善結果。如果是,則識別管理引擎接合下一言語譯碼器且循環繼續。如果結果不可能顯著地改善,則結果被接受且譯碼停止。可以針對注解訓練數據來測試可用的言語譯碼器以發展用于對言語譯碼器排序的識別精度、系統多樣性、性能或其它度量。基于該排序,言語譯碼器被排序成系列。言語譯碼器的排序是可選的以基于方案要求來提供精度與資源使用之間的權衡。在配置之后,所講言語由系列中的連續的言語譯碼器進行順序地處理。言語譯碼器對所講言語進行譯碼且將識別結果返回到識別管理器。如果沒有可用的在先識別結果,則將當前結果處理為提議識別結果。對于對所講言語進行譯碼的第二嘗試和后續嘗試,將新識別結果與在先識別結果組合以產生新的提議識別結果。識別管理器基于與提議識別結果的組件關聯的性能分數來確定所述提議識別結果的估計可靠性。識別結果可以包括通過言語譯碼器生成的譯碼后言語以及性能分數。在各實施例中,可利用組合結果中的每個譯碼后言語的諸如識別置信度的性能分數或者為統計分類器饋送與提議識別結果的組件相關聯的各個分數來獲得估計可靠性。將估計可靠性與接受閾值進行比較以判定是否將額外的資源投入于識別所講言語。如果估計可靠性值滿足或超過閾值,則提議識別結果被接受最為最終識別結果,并且所講言語的識別結束。在正常情形下,全部可用的言語譯碼器需要對較少的所講言語進行譯碼,但是最終的譯碼后言語組合將具有接近以及經常是非常接近如果用全部可用的言語譯碼器對所講言語進行譯碼且將譯碼后言語組合所能得到的最大值的精度。總體來講,增量語言識別系統能夠以小的代價捕獲全部的多個言語譯碼器組合的幾乎全部益處。附圖說明通過參考以下的附圖能夠最佳地理解本公開的進一步的特征、方面和優點,其中為了更清楚地顯示出細節元件不是按比例繪制,并且其中相似的附圖標記在全部視圖中指示相似的元件:圖1示出了在典型的操作環境中對所講言語進行增量譯碼以最小化資源使用的增量語言識別系統的一個實施例;圖2是增量語言識別系統的一個實施例的框圖;圖3是使用最少資源在多言語譯碼器環境中高效地執行離線語言識別的識別管理方法的一個實施例的高級流程圖;圖4是識別管理方法的替選實施例的高級流程圖;圖5是示出可以實現本專利技術的實施例的計算設備的物理組件的一個實施例的框圖;圖6A和6B是示出可以實現本專利技術的實施例的移動計算設備的簡化框圖;以及圖7是示出用于將如本文所述的增量語言識別功能提供給一個或多個客戶端設備的系統的體系結構的一個實施例的分布式計算系統的簡化框圖。具體實施方式下文參考構成了各個實施例的一部分的附圖來更全面地描述各個實施例,附圖顯示出具體的示范性的實施例。然而,實施例可通過多種不同的形式來實現,而不應解釋為限于本文闡述的實施例;相反,這些實施例被提供以使本公開將是全面的以及完整的,并且將向本領域技術人員充分傳達實施例的范圍。實施例可以實現為方法、系統或設備。因此,實施例可以呈現為硬件實現方式、全軟件實現方式或者組合軟件和硬件方面的實現方式的形式。下面的詳細說明因此不應在限制的意義上考量。在本文中描述了以及在附圖中圖示出增量語言識別系統的實施例。僅當額外的言語譯碼器很可能對組合結果增加顯著益處時,增量語言識別系統才使用額外的言語譯碼器對所講言語進行增量地譯碼。基于精度、性能、多樣性和其它因素按系列對可用的言語譯碼器進行排序。識別管理引擎通過言語譯碼器系列協調所講言語的譯碼,組合譯碼后言語,以及判定額外的處理是否很可能顯著地改善識別結果。如果是,則識別管理引擎接合下一言語譯碼器且循環繼續。如果精度不能得到顯著改善,則結果被接受且譯碼停止。因此,獲得精度接近該系列的最大值的譯碼后言語,而不使用該系列中的全部言語譯碼器對所講言語進行譯碼,從而最小化資源使用。圖1示出了在典型的操作環境中將所講言語進行增量地譯碼以最小化資源使用的增量語言識別系統的一個實施例。增量語言識別系統100從言語源獲得所講言語。所講言語是指講話者所發出的且以適合與言語譯碼器一起使用的形式(例如,音頻文件或流)采集到的一種或多種聲音。例如,所講言語可從與運行于客戶端設備106上的語言使能應用104交互的用戶102采集。適合的客戶端設備的示例包括但不限于,膝上型計算機、桌面式計算機、移動電話、個人數字助理、智能手機、智能手表、視頻游戲系統、智能電器(例如,智能電視機)、導航系統以及汽車娛樂系統(例如,汽車無線電)。應當意識到,客戶端設備可以將多個組成設備(例如,音頻游戲系統和電視機)組合來提供最小功能。圖示的實施例的操作環境描繪了改進實時語言識別的語言識別模型訓練方案。用于所講言語的音頻數據可以傳遞到實時(即,在線)言語譯碼器108,言語譯碼器108將語言轉換(即,識別或譯碼)成文本(即,譯碼后言語)。在圖示的實施例中,實時言語譯碼器運行于遠程計算設備110上。在其它實施例中,言語譯碼器可以運行于客戶端設備上且本地地處理所講言語。實時言語譯碼器將音頻數據譯碼且將譯碼后言語返回語言使能應用。所講言語可以添加到存儲在言語庫112中的言語歷史,以便離線使用,諸如但不限于,生成無監督訓練數據,用于語言和聲音建模、音頻檢索和自動語音郵件轉錄。運行于計算設備116上的識別管理器114對運行在一個或多個計算設備120上的多個離線言語譯碼器118的操作進行定序。每個言語譯碼器可用于獨立地對所講言語進行譯碼且由于諸如語言模型、聲音模型和譯碼引擎配置的一些系統組件的差異而提供可能不同于其它言語譯碼器的結果。言語譯碼器排序為系列。在各個實施例中,識別管理器將每個言語譯碼器進行增量地且選擇性地接合且組合結果直至發生停止條件。當返回了具有規定可靠性(例如,精度水平)的譯碼后言語或者已經通過該系列中的全部言語譯碼器對譯碼后言語進行譯碼時,發生停止條件。言語譯碼器的次序反映了通過組合來自全部可用言語譯碼器的譯碼后言語所能獲得的最大精度與通過前述使用多個言語譯碼器或者使用僅一些可用的言語譯碼本文檔來自技高網...
    <a  title="用于高效且精確譯碼的增量言語譯碼器組合原文來自X技術">用于高效且精確譯碼的增量言語譯碼器組合</a>

    【技術保護點】
    一種用于使用最少資源來對所講言語進行精確譯碼的方法,所述方法包括以下動作:將多個言語譯碼器排序為系列;以及利用所述系列中的每個言語譯碼器順序地譯碼所講言語,并且對結果進行組合直至獲得適合的精度為止。

    【技術特征摘要】
    【國外來華專利技術】2014.03.19 US 14/219,6421.一種用于使用最少資源來對所講言語進行精確譯碼的方法,所述方法包括以下動作:將多個言語譯碼器排序為系列;以及利用所述系列中的每個言語譯碼器順序地譯碼所講言語,并且對結果進行組合直至獲得適合的精度為止。2.如權利要求1所述的方法,其中,利用所述系列中的每個言語譯碼器順序地譯碼所講言語并且對結果進行組合直至獲得適合的精度為止的動作還包括以下動作:基于由所述言語譯碼器返回的置信值來確定所述結果的精度。3.如權利要求1所述的方法,其中,利用所述系列中的每個言語譯碼器順序地譯碼所講言語并且對結果進行組合直至獲得適合的精度為止的動作還包括以下動作:利用來自所述系列的第一言語譯碼器來對所述所講言語譯碼以獲得第一識別結果;以及如果精確則接受所述第一識別結果。4.如權利要求3所述的方法,其中,利用所述系列中的每個言語譯碼器順序地譯碼所講言語并且對結果進行組合直至獲得適合的精度為止的動作還包括重復以下動作:利用來自所述系列的額外的言語譯碼器對所述所講言語進行譯碼以獲得額外的識別結果;將所述額外的識別結果與先前的組合識別結果進行組合,以產生組合識別結果;以及如果精確則接受所述組合識別結果。5.如權利要求4所述的方法,還包括以下動作:確定使用所述系列中的任何言語譯碼器都不能對所講言語進行精確地譯碼;以及放棄對所述所講言語進行譯碼。6.如權利要求4所述的方法,其中,如果精確則接受所述組合識別結果的動作還包括以下動作:確定所述組合識別結果的可靠性;以及當所述組合識別結果的精度超過閾值,則接受所述組合識別結果。7.如權利要求1所述的方法,其中,將多個言語譯碼器排序為系列的動作還包括以下動作:基于識別精度度量和與每個言語譯碼器相關聯的資源使用中的至少一項來將所述多個言語譯碼器進行排列。8.如權利要求4所述的方法,還包括以下動作:基于由使用言語譯碼器的所述系列對訓練數據譯碼所獲得的結果來構建統計分類器。9.如權利要求8所述的方法,其中如果精確則接受所述組合識別結果的動作還包括以下動作:將與所述組合識別結果中的每個識別結果相關聯的識別精度分數作為輸入提供給所述統計分類器;使用所述統計分類器來確定所述組合識別結果的精度;以及當由所述統計分類器確定的所述精度達到閾值時,接受所述組合識別結果。10.一種用于使用最少資源來對所講言語進行精確譯碼的增量語言識別系統,所述增量語言識別系統包括:所講言語庫,其包含與至少一個所講言語相對應的音頻數據;多個言語譯碼器,其被基于識別精度度量、性...

    【專利技術屬性】
    技術研發人員:S·張M·列維特A·拉希里B·奧烏茲B·杜莫林
    申請(專利權)人:微軟技術許可有限責任公司
    類型:發明
    國別省市:美國;US

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 日韩av无码中文无码电影| 免费看国产成年无码AV片| 日本无码色情三级播放| 日韩久久无码免费毛片软件| 亚洲AV区无码字幕中文色| 精品人体无码一区二区三区| 国产AV无码专区亚洲AV蜜芽 | 久久无码人妻一区二区三区午夜| 中文无码喷潮在线播放| 97无码人妻福利免费公开在线视频 | 精品久久久无码人妻中文字幕豆芽 | 成人毛片无码一区二区| 亚洲精品成人无码中文毛片不卡 | 日韩人妻系列无码专区| 少妇久久久久久人妻无码| 久久青青草原亚洲AV无码麻豆| 无码人妻精一区二区三区| 97久久精品亚洲中文字幕无码| 日韩精品人妻系列无码专区| 国产精品热久久无码av| 国产精品爆乳奶水无码视频| 亚洲av无码专区国产不乱码| 无码激情做a爰片毛片AV片| 无码精品A∨在线观看免费| 亚洲一区无码中文字幕乱码| 九九久久精品无码专区| 无码人妻精品一二三区免费| 在线看片福利无码网址| 久久无码AV中文出轨人妻| 国产爆乳无码视频在线观看3| 无码人妻aⅴ一区二区三区| 无码中文在线二区免费| 蜜臀AV无码精品人妻色欲| 中文无码热在线视频| 亚洲AV无码国产剧情| 无码精品不卡一区二区三区| 久久久久久久久无码精品亚洲日韩| 无码精品国产va在线观看dvd| 无码人妻av一区二区三区蜜臀| 无码人妻一区二区三区av| 成人免费无码大片a毛片软件|