本發明專利技術的各實施例涉及語音輸入的字詞級糾正。可以在一種計算機實施的方法以及其它實施方式中實施本說明書的主題內容,其中該方法用于糾正轉錄的文字中的字詞,該方法包括從麥克風接收語音音頻數據。該方法還包括向轉錄系統發送語音音頻數據。該方法還包括接收轉錄系統從語音音頻數據轉錄的字詞網格。該方法還包括呈現來自字詞網格的一個或者多個轉錄的字詞。該方法還包括接收呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇。該方法還包括呈現來自字詞網格的用于所選轉錄的字詞的一個或者多個替代字詞。該方法還包括接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。
【技術實現步驟摘要】
【專利說明】語音輸入的字詞級糾正分案串請說明本申請是于2011年I月5日提交的、于2012年8月9日進入中國國家階段的、申請號為201180008973.4、名稱為“語音輸入的字詞級糾正”的中國專利技術專利申請的分案申請。_3] 相關串請的交叉引用本申請要求對通過引用將內容結合于此、于2010年I月5日提交并且標題為“Word-Level Correct1n of Speech Input” 的第 61/292,440 號美國臨時申請以及于2010 年 10 月 27 日提交并且標題為“Word-Level Correct1n of Speech Input” 的第12/913,407號美國申請的優先權。
本說明書涉及糾正從向計算設備的語音輸入轉錄的文字中的一個或者多個字詞。
技術介紹
語音輸入的轉錄是一種越來越流行的向計算設備中輸入信息的方式。對于移動計算設備(比如移動電話和智能電話)而言甚至更是如此,其中可用于容用戶進行用戶輸入的接口不如桌面型計算機中的用戶接口(比如全尺寸鍵盤)那樣易于操縱。例如一些移動計算設備使用最小硬件鍵盤(例如完全QWERTY鍵盤的子集)、虛擬/軟件鍵盤(例如觸屏鍵盤)或者甚至十二個鍵的電話鍵區(例如ITU-T文字錄入)。通常,這些用戶輸入接口比傳統桌面型用戶接口更小,并且用戶經常使用他們的拇指來鍵入或者在鍵入之時看一個鍵打一個字。這可以至少部分說明越來越多地使用向移動計算設備的語音輸入。
技術實現思路
總體上,本文獻描述糾正從向計算設備的語音輸入轉錄的文字中的一個或者多個字詞。在一些實施方式中,計算設備是無線移動設備(比如移動電話或者智能電話)。計算設備例如從用戶接收語音輸入并且向與計算設備分離的轉錄系統發送語音輸入。轉錄系統轉錄語音輸入并且向計算設備提供對應字詞網格。計算設備允許用戶使用來自字詞網格的替代字詞和/或短語對轉錄的文字中的一個或者多個字詞進行糾正。在第一方面中,一種用于糾正轉錄的文字中的字詞的計算機實施的方法包括從移動計算設備中的麥克風接收語音音頻數據。該方法還包括向轉錄系統發送來自移動計算設備的語音音頻數據。該方法還包括在移動計算設備接收轉錄系統從語音音頻數據轉錄的字詞網格。該方法還包括在移動計算設備的顯示器屏幕上呈現來自字詞網格的一個或者多個轉錄的字詞。該方法還包括在移動計算設備接收呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇。該方法還包括響應于接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現來自字詞網格的用于所選轉錄的字詞的一個或者多個替代字詞。該方法還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括響應于接收替代字詞的用戶選擇,用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。實施方式可以包括以下特征中的任何、所有或者零個特征。該方法可以包括:響應于接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現用于所選轉錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;并且響應于接收去除命令的用戶選擇,從呈現的轉錄的字詞去除所選轉錄的字詞。該方法可以包括:在顯示器屏幕上呈現來自字詞網格的用于呈現的轉錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;并且響應于接收替代短語的用戶選擇,用所選替代短語取代呈現的轉錄的字詞。該方法可以包括:響應于接收去除命令或者替代字詞的用戶選擇,自動基于所選替代字詞或者去除的轉錄的字詞從字詞網格選擇至少一個新的替代短語;并且用新的替代短語取代呈現的替代短語。接收呈現的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現的字詞的用戶選擇和替代字詞的用戶選擇。字詞網格可以包括與轉錄的字詞和替代字詞對應的節點、在節點之間的邊,邊標識經過字詞網格的可能路徑,并且每個路徑可以具有路徑正確的關聯概率。該方法可以包括從字詞網格中所選轉錄的字詞的開始節點與結束節點之間的一個或者多個替代路徑識別用于所選轉錄的字詞的替代字詞。該方法可以包括從字詞網格中呈現的轉錄的字詞的開始節點與結束節點之間的至少一個替代路徑識別用于呈現的轉錄的字詞的替代短語。在第二方面中,一種在計算機可讀介質上編碼的計算機程序產品,可操作用于使一個或者多個處理器執行用于糾正轉錄的文字中的字詞的操作,操作包括從移動計算設備中的麥克風接收語音音頻數據。操作還包括向轉錄系統發送來自移動計算設備的語音音頻數據。操作還包括在移動計算設備接收轉錄系統從語音音頻數據轉錄的字詞網格。操作還包括在移動計算設備的顯示器屏幕上呈現來自字詞網格的一個或者多個轉錄的字詞。操作還包括在移動計算設備接收呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇。操作還包括響應于接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現來自字詞網格的用于所選轉錄的字詞的一個或者多個替代字詞。操作還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。操作還包括響應于接收替代字詞的用戶選擇,用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。實施方式可以包括以下特征中的任何、所有或者零個特征。操作可以包括:響應于接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現用于所選轉錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;并且響應于接收去除命令的用戶選擇,從呈現的轉錄的字詞去除所選轉錄的字詞。操作可以包括:在顯示器屏幕上呈現來自字詞網格的用于呈現的轉錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;并且響應于接收替代短語的用戶選擇,用所選替代短語取代呈現的轉錄的字詞。操作可以包括:響應于接收去除命令或者替代字詞的用戶選擇,自動基于所選替代字詞或者去除的轉錄的字詞從字詞網格選擇至少一個新的替代短語;并且用新的替代短語取代呈現的替代短語。接收呈現的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現的字詞的用戶選擇和替代字詞的用戶選擇。字詞網格可以包括與轉錄的字詞和替代字詞對應的節點、在節點之間的邊,邊標識經過字詞網格的可能路徑,并且每個路徑可以具有路徑正確的關聯概率。操作可以包括從字詞網格中所選轉錄的字詞的開始節點與結束節點之間的一個或者多個替代路徑識別用于所選轉錄的字詞的替代字詞。操作可以包括從字詞網格中呈現的轉錄的字詞的開始節點與結束節點之間的至少一個替代路徑識別用于呈現的轉錄的字詞的替代短語。在第三方面中,一種用于糾正轉錄的文字中的字詞的計算機實施的系統包括??轉錄系統,可操作用于接收語音音頻數據并且作為響應將語音音頻數據轉錄成字詞網格。該系統還包括移動計算設備,移動計算設備包括:麥克風,可操作用于接收語音音頻并且生成語音音頻數據,網絡接口,可操作用于向轉錄系統發送語音音頻數據并且作為響應從轉錄系統接收字詞網格,顯示器屏幕,可操作用于呈現來自字詞網格的一個或者多個轉錄的字詞,用戶接口,可操作用于接收轉錄的字詞中的至少一個轉錄的字詞的用戶選擇,一個或者多個處理器和存儲指令的存儲器,指令在由處理器執行時執行以下操作:在顯示器屏幕上呈現來自字詞網格的用于所選轉錄的字詞的一個或者多個替代字詞;接收替代字詞中的至少一個替代字詞的用戶選擇;并且用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。這里描述的系統和技術本文檔來自技高網...
【技術保護點】
一種計算機實施的方法,包括:在計算設備的顯示器屏幕上呈現包括來自字詞網格的一個或者多個轉錄的字詞的第一短語;在所述計算設備處接收對來自所述第一短語的字詞的用戶選擇;響應于接收到對所述字詞的所述用戶選擇,在所述計算設備的所述顯示器屏幕上呈現(i)各自對應于用于來自所述字詞網格的用戶選擇的所述字詞的一個或者多個替代字詞的一個或者多個控件,以及(ii)與用于去除用戶選擇的所述字詞的去除命令對應的控件;在所述計算設備處接收對與所述去除命令對應的所述控件的用戶選擇;以及響應于接收到對與所述去除命令對應的所述控件的所述用戶選擇,(i)從所述字詞網格選擇不包括用戶選擇的所述字詞的第二短語,以及(ii)在所述顯示器屏幕上用所述第二短語取代所述第一短語。
【技術特征摘要】
...
【專利技術屬性】
技術研發人員:M·J·勒鮑,W·J·伯恩,J·N·吉科夫,B·M·巴林格爾,T·克里斯簡森,
申請(專利權)人:谷歌公司,
類型:發明
國別省市:美國;US
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。