本發明專利技術涉及一種交互式3D語音服務系統,包括用戶終端和服務器,其中,所述用戶終端,用于采集用戶的表情和語音并上傳給所述服務器;所述服務器,用于接收和處理所述表情和語音,生成3D虛擬人物視頻并發送給所述用戶終端。本發明專利技術基于語音識別技術和3D虛擬人物技術,將其與電視機、家庭智能設備、移動智能終端等結合,通過采集用戶的表情和語音,并根據該語音提取關鍵詞,通過搜索得到與關鍵詞對應的結果,并將該表情和語音賦予在3D虛擬人物模型上,形成3D虛擬人物視頻并發送給用戶終端,由用戶終端播放和顯示,完成用戶的需求。
【技術實現步驟摘要】
【專利摘要】本專利技術涉及一種交互式3D語音服務系統,包括用戶終端和服務器,其中,所述用戶終端,用于采集用戶的表情和語音并上傳給所述服務器;所述服務器,用于接收和處理所述表情和語音,生成3D虛擬人物視頻并發送給所述用戶終端。本專利技術基于語音識別技術和3D虛擬人物技術,將其與電視機、家庭智能設備、移動智能終端等結合,通過采集用戶的表情和語音,并根據該語音提取關鍵詞,通過搜索得到與關鍵詞對應的結果,并將該表情和語音賦予在3D虛擬人物模型上,形成3D虛擬人物視頻并發送給用戶終端,由用戶終端播放和顯示,完成用戶的需求。【專利說明】交互式3D語音服務系統
本專利技術涉及一種服務系統,尤其涉及一種交互式3D語音服務系統。
技術介紹
在家庭中,由于網絡電視可提供給用戶的內容資源過多,有時為了收看一些特定的節目,不得不在大量的節目單中找尋,浪費了大量的時間,造成使用上的不便;另外,在很多公眾場合,設置了一些用于信息查詢的終端,其一般是由觸摸屏和電腦一起構成,由用戶通過觸摸來進行查詢或者用鼠標、鍵盤來查詢,不能直接通過會話來進行信息查詢,這對一些手部不靈活的人造成了很大的不便,使得服務缺乏人性化。
技術實現思路
本專利技術克服了現有技術的不足,提供一種使用便捷、反應快速的交互式3D語音服務系統。為達到上述目的,本專利技術采用的技術方案為:一種交互式3D語音服務系統,包括用戶終端和服務器,其中, 所述用戶終端,用于采集用戶的表情和語音并上傳給所述服務器; 所述服務器,用于接收、處理所述表情和語音,生成3D虛擬人物視頻并發送給所述用戶終端。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述用戶終端包括攝像模塊、語音模塊和播放模塊。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述服務器包括表情接收模塊、語音接收模塊、表情處理模塊、語音處理模塊、搜索模塊、數據庫、表情重現模塊和語音重現模塊。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述語音處理模塊包括語音轉文字模塊和文字轉語音模塊。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述搜索模塊根據所述語音轉文字模塊提取的關鍵詞在所述數據庫中進行搜索。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述搜索模塊根據所述語音轉文字模塊提取的關鍵詞通過連接無線網絡進行搜索。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述搜索的結果反饋給所述文字轉語音模塊。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述用戶終端還包括將所述表情和語音發送給所述服務器的上傳模塊。本專利技術一個較佳實施例中,交互式3D語音服務系統進一步包括所述上傳模塊通過無線網絡將所述表情和語音發送給所述服務器。本專利技術解決了
技術介紹
中存在的缺陷,本專利技術基于語音識別技術和3D虛擬人物技術,將其與電視機、家庭智能設備、移動智能終端等結合,通過采集用戶的表情和語音,并根據該語音提取關鍵詞,通過搜索得到與關鍵詞對應的結果,并將該表情和語音賦予在3D虛擬人物模型上,形成3D虛擬人物視頻并發送給用戶終端,由用戶終端播放和顯示,完成用戶的需求。【專利附圖】【附圖說明】下面結合附圖和實施例對本專利技術進一步說明。圖1是本專利技術的優選實施例的結構框圖; 圖中:2、用戶終端,4、服務器,6、攝像裝置,8、語音模塊,10、上傳模塊,12、播放模塊,14、表情接收模塊,16、語音接收模塊,18、表情處理模塊,20、語音處理模塊,22、搜索模塊,24、數據庫,26、表情重現模塊,28、語音重新模塊,30、語音轉文字模塊,32、文字轉語音模塊,34、3D虛擬人模型。【具體實施方式】現在結合附圖和實施例對本專利技術作進一步詳細的說明,這些附圖均為簡化的示意圖,僅以示意方式說明本專利技術的基本結構,因此其僅顯示與本專利技術有關的構成。如圖1所示,一種交互式3D語音服務系統,包括用戶終端2和服務器4。其中,用戶終端2為智能電視機、電腦、智能手機、銀行終端、醫院終端等,用于采集用戶的表情和語音并上傳給服務器4;服務器4,用于接收、處理表情和語音,生成3D虛擬人物視頻并發送給用戶終端2。本專利技術優選用戶終端2包括攝像模塊6、語音模塊8、上傳模塊10和播放模塊12。攝像模塊6為攝像頭,用于采集用戶的表情;語音模塊8為麥克風,用于采集用戶的語音;上傳模塊10通過無線網絡將采集的表情和語音發送給服務器4,該無線網絡可以為紅外、微波、WIFI或3G網絡;播放模塊12用于播放服務器4傳送的3D虛擬人物視頻。服務器4包括表情接收模塊14、語音接收模塊16、表情處理模塊18、語音處理模塊20、搜索模塊22、數據庫24、表情重現模塊26和語音重現模塊28。其中,表情處理模塊18用于將用戶的表情分割成由若干個單一五官或臉部肌肉位置組成的表情記錄;語音處理模塊20包括語音轉文字模塊30和文字轉語音模塊32,用于將用戶的語音轉換成文字和將文字轉換成用戶的語音;搜索模塊22根據語音轉文字模塊30提取的文字形式的關鍵詞在數據庫24中進行搜索;或者當數據庫24內所存儲的內容沒有與關鍵詞匹配的內容時,搜索模塊22根據語音轉文字模塊30提取的文字形式的關鍵詞通過連接無線網絡進行搜索;搜索的結果反饋給文字轉語音模塊32,將搜索到的文字形式的結果轉換成語音。本專利技術的交互式3D語音服務系統在使用時,用戶通過語音和表情向用戶終端發送需求,如用戶到達一個醫院,需要尋找眼科醫生的相關信息,則只需要說“我眼睛疼”,用戶終端2的攝像模塊6和語音模塊8采集用戶的表情和語音并上傳至服務器4,服務器4通過3D建模軟件制作出3D虛擬人模型34,語音處理模塊20的語音轉文字模塊30提取語音的“眼睛”關鍵詞并轉換為文字形式,通過搜索模塊22在數據庫24內或通過連接無線網絡進行搜索,將眼科醫生的相關信息傳送給文字轉語音模塊32,表情處理模塊18將表情分割成由若干個單一五官或臉部肌肉位置組成的表情記錄,例如眨眼、眼睛睜大、嘴巴鼓起等,文字轉語音模塊32將搜索的結果轉換成用戶的語音,再通過表情重現模塊26和語音重現模塊28在3D虛擬人模型34上重現用戶的表情和語音,3D虛擬人模型34會做與用戶相同的表情,同時說出“眼科醫生在三樓305室”,形成3D虛擬人物視頻,最后發送給用戶終端2,由播放模塊12播放。以上依據本專利技術的理想實施例為啟示,通過上述的說明內容,相關人員完全可以在不偏離本項專利技術技術思想的范圍內,進行多樣的變更以及修改。本項專利技術的技術性范圍并不局限于說明書上的內容,必須要根據權利要求范圍來確定技術性范圍。【權利要求】1.一種交互式3D語音服務系統,其特征在于,包括用戶終端和服務器,其中, 所述用戶終端,用于采集用戶的表情和語音并上傳給所述服務器; 所述服務器,用于接收、處理所述表情和語音,生成3D虛擬人物視頻并發送給所述用戶終端。2.根據權利要求1所述的交互式3D語音服務系統,其特征在于:所述用戶終端包括攝像模塊、語音模塊和播放模塊。3.根據權利要求2所述的交互式3D語音服務系統,其特征在于:所述服務器包括表情接收模塊、語音接收模塊、表情處理模塊、語音處理模塊、搜索模塊、數據庫、表情重現模塊和語音重現模塊。4.根據權利要求3所述的交互式3D語音服本文檔來自技高網...
【技術保護點】
一種交互式3D語音服務系統,其特征在于,包括用戶終端和服務器,其中,所述用戶終端,用于采集用戶的表情和語音并上傳給所述服務器;所述服務器,用于接收、處理所述表情和語音,生成3D虛擬人物視頻并發送給所述用戶終端。
【技術特征摘要】
【專利技術屬性】
技術研發人員:張國祥,羅霄,
申請(專利權)人:蘇州跨界軟件科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。