一些實施例致力于允許用戶提供輸入到未連接至執行語音使能應用程序的計算機的移動通信裝置,如智能電話中的、旨在用于該語音使能應用程序的語音輸入。該移動通信裝置可以將用戶的語音輸入作為音頻數據提供給在服務器上執行的代理應用,其確定要向哪個計算機提供所接收音頻數據。當代理應用確定了要將音頻數據提供至其的計算機時,其將該音頻數據發送至該計算機。在一些實施例中,自動語音識別可以在將音頻數據提供給計算機之前針對其執行。在這種實施例中,代替提供音頻數據,代理應用可以將根據執行自動語音識別而生成的識別結果發送至所標識計算機。
【技術實現步驟摘要】
【國外來華專利技術】
在此描述的技術總體上致力于促進用戶與語音使能應用程序的相互作用。
技術介紹
語音使能軟件應用程序是能夠經由從用戶提供的語音輸入來與該用戶相互作用的和/或能夠按語音形式向人類用戶提供輸出的軟件應用程序。語音使能應用在許多不同環境中使用,如字處理應用、電子郵件應用、文本消息和web瀏覽應用、手持式裝置命令和控制,以及許多其它方面。這種應用可以是專有語音輸入應用,或者可以是能夠進行多種類型的用戶相互作用(例如,視覺、文本、以及/或其它類型的相互作用)的多模態化應用。當用戶通過講話與語音使能應用通信時,通常使用自動語音識別來確定用戶話語的內容。接著,語音使能應用可以基于所確定的用戶話語內容來確定要采取的恰當動作。圖1示出了包括計算機101的常規系統,計算機101執行語音使能應用程序105和自動語音識別(ASR)引擎103。用戶107可以經由麥克風109向應用程序105提供語音輸入,該麥克風經由有線連接或無線連接直接連接至計算機101。當用戶對著麥克風109講話時,將語音輸入提供給ASR引擎103,該ASR引擎針對該語音輸入執行自動語音識別,并將文本識別結果提供給應用程序105。
技術實現思路
一個實施例致力于提供一種向在計算機上執行的語音使能應用程序提供輸入的方法。該方法包括在至少一個服務器計算機處接收從未通過有線或無線連接方式連接至所述計算機的移動通信裝置所提供的音頻數據;在所述至少一個服務器計算機處獲取根據針對該音頻數據執行自動語音識別而生成的識別結果;以及將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。另一實施例致力于提供編碼有指令的至少一個非臨時性有形計算機可讀介質,該指令在執行時執行上述方法。另一實施例致力于提供至少一個服務器計算機,該服務器計算機包括至少一個有形存儲介質,該至少一個有形存儲介質存儲用于向在計算機上執行的語音使能應用程序提供輸入的處理器可執行指令;和至少一個硬件處理器,該至少一個硬件處理器執行該處理器可執行指令,以使在所述至少一個服務器計算機處接收從未通過有線或無線連接方式連接至所述計算機的移動通信裝置提供的音頻數據;在所述至少一個服務器計算機處獲取由針對該音頻數據執行自動語音識別而生成的識別結果;以及將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。附圖說明在圖中圖1是執行語音使能應用程序的現有技術計算機的框圖;圖2是根據一些實施例的計算機系統的框圖,其中,旨在用于在計算機上執行的語音使能應用程序的語音輸入可以經由未連接至該計算機的移動通信裝置來提供;圖3是根據一些實施例的、用于利用移動通信裝置向語音使能應用提供根據語音輸入生成的輸入的處理的流程圖;圖4是根據一些實施例的計算機系統的框圖,其中,旨在用于在計算機上執行的語音使能應用程序的語音輸入可以經由未連接至該計算機的移動通信裝置來提供,并且其中,在與執行該語音使能應用程序的計算機不同的計算機上執行自動語音識別;圖5是根據一些實施例的計算機系統的框圖,其中,旨在用于在計算機上執行的語音使能應用程序的語音輸入可以經由連接至該計算機的移動通信裝置來提供;以及圖6是可以在一些實施例中使用以實現圖2、4以及5中描繪的計算機和裝置的計算機裝置的框圖。具體實施例方式為向語音使能應用提供語音輸入,用戶通常對著所連接(有線或者無線地)或內置于計算機的麥克風講話,經由該麥克風,用戶與語音使能應用相互作用。專利技術人已經認識至IJ,用戶使用這種麥克風來向語音使能應用提供語音輸入的需要可能導致許多不便利。具體來說,一些計算機可能沒有內置麥克風。由此,用戶必須獲取麥克風,并將其連接至他或她用來經由語音接入語音使能應用的計算機。另外,如果計算機是共享計算機,則連接至其的麥克風可以是由許多不同的人共享的麥克風。由此,麥克風可能是用于在人與人之間傳染病原體(例如,病毒、細菌以及/或其它傳染體)的通路。雖然下面討論的實施例中的一些致力于解決上面討論的所有不便和缺陷,但不是每一個實施例都致力于解決所有這些不便和缺陷,并且一些實施例可能不解決它們中的任一個。因此,應當明白,本專利技術不限于解決所有或任何上述不便或缺陷的實施例。一些實施例致力于提供這樣的系統和/或方法,其中,用戶可以經由移動電話或其它手持式移動通信裝置來向語音使能應用程序提供語音輸入,而不必使用直接連接至用戶用來接入語音使能應用程序的計算機的專用麥克風。這可以按多種方法中的任一個來實現,其中,一些非限制詳細示例在下面進行描述。專利技術人已經認識到,因為許多人自己的個人裝置(例如,移動電話或其它手持式移動計算裝置)通常具有內置麥克風,所以這種裝置上的麥克風可以被用于接收要作為輸入提供給在與這些裝置分離的計算機上執行的語音使能應用程序的用戶語音。這樣,用戶不需要定位專用麥克風并將其連接至執行語音使能應用的計算機,或者使用連接至計算機的共享麥克風以經由話音與語音使能應用程序相互作用。圖2示出了一種計算機系統,其中,用戶可以向手持式移動通信裝置提供語音輸入,以與在和該手持式移動通信裝置分離的計算機上執行的語音使能應用程序相互作用。圖2所示的計算機系統包括移動通信裝置203、計算機205、以及一個或多個服務器211。計算機205執行至少一個語音使能應用程序207和至少一個自動語音識別(ASR)引擎209。在一些實施例中,計算機205可以是用戶217的個人計算機,經由該計算機,用戶217可以與一個或多個輸入/輸出(I/O)裝置(例如,鼠標器、鍵盤、顯示裝置,以及/或任何其它合適I/O裝置)相互作用。該計算機可以有或沒有內置麥克風。在一些實施例中,計算機205可以是用作用戶的家庭計算機的個人計算機,或者可以是用戶在其上具有賬戶(例如,企業賬戶)的工作站或終端,并且,可以是用戶用作接入語音使能應用程序的接口。在其它實施例中,計算機205可以是應用主機服務器,或者向用戶217的個人計算機(未示出)上的虛擬化客戶端遞送語音使能應用207的虛擬化服務器。移動通信裝置203可以是各種可能類型的移動通信裝置中的任一種,例如,包括智能電話(例如,蜂窩移動電話)、個人數字助理、和/或任何其它合適類型的移動通信裝置。在一些實施例中,該移動通信裝置可以是手持式和/或掌上型裝置。在一些實施例中,該移動通信裝置可以是能夠通過因特網發送和接收信息的裝置。而且,在一些實施例中,該移動通信裝置可以是具有能夠(和/或被配置用于)執行應用程序的通用處理器,和能夠存儲要通過該通用處理器執行的應用程序的有形存儲器或其它類型的有形計算機可讀介質的裝置。在一些實施例中,移動通信裝置可以包括可以向其用戶顯示信息的顯示器。雖然移動通信裝置203在一些實施例中包括內置麥克風,但移動通信裝置除了僅僅將聲學聲音轉換成電信號并通過有線或無線連接提供該電信號以外還提供一些附加功能。服務器211可以包括執行代理應用219的一個或多個服務器計算機。代理應用219可以是這樣的應用,即,在接收到來自移動通信裝置的音頻時,確定要將所接收音頻發送至哪個計算機或其它裝置,并將該音頻發送至該目的地裝置。如下更詳細說明的,該音頻可以被“推送(pushed)”至目的地裝置,或者被目的地裝置“拉出(pulled)”。應當清楚,盡管本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】2010.09.08 US 12/877,3471.一種向在計算機上執行的語音使能應用程序提供輸入的方法,該方法包括: 在至少一個服務器計算機處接收由未通過有線或無線連接方式連接至所述計算機的移動通信裝置所提供的音頻數據; 在所述至少一個服務器計算機處獲取根據針對該音頻數據執行自動語音識別而生成的識別結果;以及 將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。2.根據權利要求1所述的方法,其中,該移動通信裝置包括智能電話。3.根據權利要求1所述的方法,其中,所述至少一個服務器是至少一個第一服務器,并且其中,獲取該識別結果的動作還包括: 將該音頻數據發送至在至少一個第二服務器上執行的自動語音識別(ASR)引擎;并且 在所述至少一個第二服務器上接收來自所述至少一個(ASR)引擎的識別結果。4.根據權利要求1所述的方法,其中,獲取該識別結果的動作還包括: 利用在所述至少一個服務器上執行的至少一個自動語音識別(ASR)引擎來生成識別結果。5.根據權利要求1所述的方法,其中,該計算機是多個計算機中的第一計算機,并且其中,所述方法還包括: 從移動通信裝置接收與所述音頻數據相關聯的標識符;并且 利用該標識符來確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機。6.根據權利要求5所述的方法,其中,該標識符是第一標識符,并且其中,利用該第一標識符來確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機的動作還包括: 接收來自第一計算機的針對音頻數據的請求,該請求包括第二標識符; 確定第一標識符是否與第二標識符匹配或映射至第二標識符;以及當確定第一標識符與第二標識符匹配或映射至第二標識符時,確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機。7.根據權利要求6所述的方法,其中,將識別結果從所述至少一個服務器計算機發送至執行語音使能應用程序的計算機的動作響應于確定第一計算機是所述多個計算機中要將識別結果發送至其的計算機而執行。8.編碼有指令的至少一個非臨時性有形計算機可讀介質,該指令當通過至少一個服務器計算機的至少一個處理器被執行時,執行向在計算機上執行的語音使能應用程序提供輸入的方法,該方法包括: 在所述至少一個服務器計算機處接收由未通過有線或無線連接方式連接至所述計算機的移動通信裝置所提供的音頻數據; 在所述至少一個服務器計算機處獲取根據針對該音頻數據執行自動語音識別而生成的識別結果;以及 將該識別結果從所述至少一個服務器計算機發送至執行該語音使能應用程序的所述計算機。9.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質,其中,該移動通信裝置包括智能電話。10.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質,其中,所述至少一個服務器是至少一個第一服務器,并且其中,獲取識別結果的動作還包括: 將該音頻數據發送至在至少一個第二服務器上執行的自動語音識別(ASR)引擎;并且 在所述至少一個第二服務器上接收來自所述至少一個(ASR)引擎的識別結果。11.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質,其中,獲取該識別結果的動作還包括: 利用在所述至少一個服務器上執行的至少一個自動語音識別(ASR)引擎來生成識別結果。12.根據權利要求8所述的至少一個非臨時性有形計算機可讀介質,其中,該...
【專利技術屬性】
技術研發人員:J·M·卡塔爾斯,
申請(專利權)人:紐昂斯通訊公司,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。