用于向語音使能應用程序提供輸入的方法和裝置制造方法及圖紙

技術編號：8659773 閱讀：197 留言：0更新日期：2013-05-02 06:56

一些實施例致力于允許用戶提供輸入到未連接至執行語音使能應用程序的計算機的移動通信裝置，如智能電話中的、旨在用于該語音使能應用程序的語音輸入。該移動通信裝置可以將用戶的語音輸入作為音頻數據提供給在服務器上執行的代理應用，其確定要向哪個計算機提供所接收音頻數據。當代理應用確定了要將音頻數據提供至其的計算機時，其將該音頻數據發送至該計算機。在一些實施例中，自動語音識別可以在將音頻數據提供給計算機之前針對其執行。在這種實施例中，代替提供音頻數據，代理應用可以將根據執行自動語音識別而生成的識別結果發送至所標識計算機。

全部詳細技術資料下載

【技術實現步驟摘要】
【國外來華專利技術】
在此描述的技術總體上致力于促進用戶與語音使能應用程序的相互作用。
技術介紹
語音使能軟件應用程序是能夠經由從用戶提供的語音輸入來與該用戶相互作用的和/或能夠按語音形式向人類用戶提供輸出的軟件應用程序。語音使能應用在許多不同環境中使用，如字處理應用、電子郵件應用、文本消息和web瀏覽應用、手持式裝置命令和控制，以及許多其它方面。這種應用可以是專有語音輸入應用，或者可以是能夠進行多種類型的用戶相互作用(例如，視覺、文本、以及/或其它類型的相互作用)的多模態化應用。當用戶通過講話與語音使能應用通信時，通常使用自動語音識別來確定用戶話語的內容。接著，語音使能應用可以基于所確定的用戶話語內容來確定要采取的恰當動作。圖1示出了包括計算機101的常規系統，計算機101執行語音使能應用程序105和自動語音識別(ASR)引擎103。用戶107可以經由麥克風109向應用程序105提供語音輸入，該麥克風經由有線連接或無線連接直接連接至計算機101。當用戶對著麥克風109講話時，將語音輸入提供給ASR引擎103，該ASR引擎針對該語音輸入執行自動語音識別，并將文本識別結果提供給應用程序105。
技術實現思路
一個實施例致力于提供一種向在計算機上執行的語音使能應用程序提供輸入的方法。該方法包括在至少一個服務器計算機處接收從未通過有線或無線連接方式連接至所述計算機的移動通信裝置所提供的音頻數據；在所述至少一個服務器計算機處獲取根據針對該音頻數據執行自動語音識別而生成的識別結果；以及將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。另一實施例致力于提供編碼有...

【技術保護點】

【技術特征摘要】
【國外來華專利技術】2010.09.08 US 12/877,3471.一種向在計算機上執行的語音使能應用程序提供輸入的方法，該方法包括: 在至少一個服務器計算機處接收由未通過有線或無線連接方式連接至所述計算機的移動通信裝置所提供的音頻數據；在所述至少一個服務器計算機處獲取根據針對該音頻數據執行自動語音識別而生成的識別結果；以及將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。2.根據權利要求1所述的方法，其中，該移動通信裝置包括智能電話。3.根據權利要求1所述的方法，其中，所述至少一個服務器是至少一個第一服務器，并且其中，獲取該識別結果的動作還包括: 將該音頻數據發送至在至少一個第二服務器上執行的自動語音識別(ASR)引擎；并且在所述至少一個第二服務器上接收來自所述至少一個(ASR)引擎的識別結果。4.根據權利要求1所述的方法，其中，獲取該識別結果的動作還包括: 利用在所述至少一個服務器上執行的至少一個自動語音識別(ASR)引擎來生成識別結果。5.根據權利要求1所述的方法，其中，該計算機是多個計算機中的第一計算機，并且其中，所述方法還包括: 從移動通信裝置接收與所述音頻數據相關聯的標識符；并且利用該標識符來確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機。6.根據權利要求5所述的方法，其中，該標識符是第一標識符，并且其中，利用該第一標識符來確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機的動作還包括: 接收來自第一計算機的針對音頻數據的請求，該請求包括第二標識符；確定第一標識符是否與第二標識符匹配或映射至第二標識符；以及當確定第一標識符與第二標識符匹配或映射至第二標識符時，確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機。7.根據權利要求6所述的方法，其中，將識別結果從所述至少一個服務器計算機發送至執行語音使能應用程序的計算機的動作響應于確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機而執行。8.編碼有指令的至少一個非臨時性有形計算機可讀介質，該指令當通過至少一個服務器計算機的至少一個處理器被執行時，執行向在計算機上執行的語音使能應用程序提供輸入的方法，該方法包括: 在所述至少一個服務器計算機處接收由未通過有線或無線連接方式連接至所述計算機的移動通信裝置所提供的音頻數據；在所述至少一個服務器計算機處獲取根據針對該音頻數據執行自動語音識別而生成的識別結果；以及將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。9.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質，其中，該移動通信裝置包括智能電話。10.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質，其中，所述至少一個服務器是至少一個第一服務器，并且其中，獲取識別結果的動作還包括: 將該音頻數據發送至在至少一個第二服務器上執行的自動語音識別(ASR)引擎；并且在所述至少一個第二服務器上接收來自所述至少一個(ASR)引擎的識別結果。11.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質，其中，獲取該識別結果的動作還包括: 利用在所述至少一個服務器上執行的至少一個自動語音識別(ASR)引擎來生成識別結果。12.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質，其中，該...

【專利技術屬性】
技術研發人員：J·M·卡塔爾斯，
申請(專利權)人：紐昂斯通訊公司，
類型：
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術