System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能領域,尤其涉及一種語音驅動機器人嘴部開合的方法、機器人、電子設備及計算機可讀介質。
技術介紹
1、目前,人工智能技術和機器人控制技術正在飛速發展,具有人類仿生結構的機器人已經逐步進入到人們的工作生活當中,消費者對陪伴、接待、服務等仿生機器人的面部交互運動仿真度要求越來越高,縱觀機器人仿生的發展歷程,從最早電子屏幕虛擬出的人類臉部形象機器人到有實體仿生真人結構、皮膚的靜態機器人形象以及到目前既有真人面部皮膚仿真形象還要有面部運動細節仿真。消費者對機器人的仿真度越來越高。在面部表情運動中,與人交互,尤其是采用不同語言交互,機器人的嘴部的開合運動是人們重點關注的運動單元之一。
2、但是,目前的語音驅動機器人嘴部開合運動的方法的實現成本比較高。
技術實現思路
1、本申請提供了一種語音驅動機器人嘴部開合的方法、電子設備及計算機可讀介質,實現成本比較低。
2、根據本申請實施例的一方面,本申請提供了一種通過語音驅動機器人嘴部開合的方法,所述方法包括:
3、步驟1,獲取機器人的目標語音;
4、步驟2,對所述目標語音進進行分幀處理,生個多個分幀音頻數據,使得每個分幀音頻數據的時間長度在預定時長之間;所述多個分幀音頻數據之間具有時序;
5、步驟3,分別對多個所述分幀音頻數據進行處理,生成所述分幀音頻數據對應的嘴部運動驅動數據;
6、步驟4,根據所述多個分幀音頻數據的時序,將所述分幀音頻數據對應的嘴部運動驅動數據發
7、所述步驟3具體為:
8、步驟31,對所述分幀音頻數據進項歸一化處理,生成分幀音頻數據對應的歸一化音頻數據;
9、步驟32,按照預定的采樣率,對所述歸一化音頻數據進行采樣,生成采樣后的信號數據;
10、步驟33,根據嘴部運動聯動結構轉化比,對所述采樣后的信號數據進行運動幅度補償,生成所述分幀音頻數據對應的嘴部運動幅度數據,作為嘴部運動驅動數據。
11、所述步驟31具體為:
12、步驟311,對所述分幀音頻數據進行濾波降噪處理,使得所述分幀音頻數據的語音間隙之前的音強為0,生個降噪后的分幀音頻數據;
13、步驟312,對降噪后的分幀音頻數據進行消除直流分量處理,生成消除直流分量后的分幀音頻數據;
14、步驟313,對所述消除直流分量后的分幀音頻數據進項歸一化處理,生成歸一化處理后的分幀音頻數據。
15、所述步驟311包括:
16、步驟3111,將所述分幀音頻數據的每幀音頻數據轉換成振幅數據;
17、步驟3112,根據預定的語音間隙的噪音閾值,確定預定切片的起始點和截止點,對所述振幅數據進行切片;
18、步驟3113,對消除低于所述噪音閾值的所述振幅數據,進行音頻數據重組,生成降噪后的分幀音頻數據。
19、所述步驟312具體根據以下公式處理:
20、f?a(t)=f(t)-f?d
21、n=fs*t
22、
23、其中,f?a(t)為分幀音頻數據的交流分量,也就是消除直流分量后的分幀音頻數據;f(t)為分幀音頻數據的音頻信號;f?d為分幀音頻數據的直流分量;t為分幀音頻數據的長度,fs為分幀音頻數據的采樣率;x為分幀音頻數據的每個音頻采樣數據;n為每個音頻采樣數據的序號。
24、所述步驟313具體為根據以下公式處理:
25、x’為每個音頻采樣數據歸一化后的數據;
26、
27、其中,min(x)為分幀音頻數據的每個音頻采樣數據重的最小值;max(x)為分幀音頻數據的每個音頻采樣數據重的最大值。
28、所述步驟32具體為:
29、采用下采樣方式,將所述歸一化音頻數據x(n)的采樣頻率fsa減少m倍,每隔m個點抽取一個點,生成采樣后的信號數據y(n),y(n)的頻率為機器人嘴部運動的頻率fsr;
30、m根據以下公式進行確定:
31、
32、其中,fsa為歸一化音頻數據x(n)的采樣頻率;fsr為機器人嘴部運動的頻率。
33、所述步驟33具體為:
34、x>=a時:x’=x+b
35、x<a時:x’=x
36、x為采樣后的信號數據;x’為嘴部運動幅度數據;
37、其中,a為修正條件閾值;b為補償因子值;
38、修正條件閾值a和補償因子b值的確定,根據嘴部電機驅動連接機構采用運動數據,進行采樣和特征提取分析獲得。
39、根據本申請實施例的另一方面,本申請提供了一種通過語音驅動機器人嘴部開合的裝置,所述裝置包括:
40、音頻獲取模塊,用于獲取機器人的目標語音;
41、音頻分幀模塊,用于對所述目標語音進進行分幀處理,生個多個分幀音頻數據;
42、語音數據處理模塊,用于分別對多個所述分幀音頻數據進行處理,生成所述分幀音頻數據對應的嘴部運動驅動數據;
43、發送模塊,根據所述多個分幀音頻數據的時序,將所述分幀音頻數據對應的嘴部運動驅動數據發送給機器人,以驅動機器人的嘴部運動。
44、本申請還提供一種機器人,包括所述的裝置。
45、根據本申請實施例的另一方面,本申請提供了一種電子設備,包括存儲器、處理器、通信接口及通信總線,所述存儲器中存儲有可在所述處理器上運行的計算機程序,所述存儲器、所述處理器通過所述通信總線和所述通信接口進行通信,所述處理器執行所述計算機程序時實現所述的數據存儲及讀取方法的步驟。
46、根據本申請實施例的另一方面,本申請還提供了一種具有處理器可執行的非易失的程序代碼的計算機可讀介質,所述程序代碼使所述處理器執行所述的數據存儲及讀取方法的步驟。
47、本申請實施例提供的上述技術方案與現有技術相比具有如下優點:本申請實施例提供的該方法,本專利技術通過對機器人的所述目標語音進進行分幀處理,生個多個分幀音頻數據,使得每個分幀音頻數據的時間長度在預定時長之間;所述多個分幀音頻數據之間具有時序;分別對多個所述分幀音頻數據進行處理,生成所述分幀音頻數據對應的嘴部運動驅動數據;根據所述多個分幀音頻數據的時序,將所述分幀音頻數據對應的嘴部運動驅動數據發送給機器人電機驅動層,以驅動機器人的嘴部運動。在獲取到語音數據后,降噪轉換不需要復雜的計算,算力要求不高:普通的硬件設備完全可以滿足算力的要求,實現成本比較低。
本文檔來自技高網...【技術保護點】
1.一種通過語音驅動機器人嘴部開合的方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述步驟3具體為:
3.根據權利要求2所述的方法,其特征在于,所述步驟31具體為:
4.根據權利要求3所述的方法,其特征在于,所述步驟311包括:
5.根據權利要求3所述的方法,其特征在于,所述步驟312具體根據以下公式處理:
6.根據權利要求5所述的方法,其特征在于,所述步驟32具體為:
7.一種通過語音驅動機器人嘴部開合的裝置,其特征在于,所述裝置包括:
8.一種機器人,其特征在于,包括權利要求8所述的裝置。
9.一種電子設備,包括存儲器、處理器、通信接口及通信總線,所述存儲器中存儲有可在所述處理器上運行的計算機程序,所述存儲器、所述處理器通過所述通信總線和所述通信接口進行通信,其特征在于,所述處理器執行所述計算機程序時實現上述權利要求1至6任一項所述的數據存儲及讀取方法。
10.一種具有處理器可執行的非易失的程序代碼的計算機可讀介質,其特征在于,所述程序代碼使所述處
...【技術特征摘要】
1.一種通過語音驅動機器人嘴部開合的方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述步驟3具體為:
3.根據權利要求2所述的方法,其特征在于,所述步驟31具體為:
4.根據權利要求3所述的方法,其特征在于,所述步驟311包括:
5.根據權利要求3所述的方法,其特征在于,所述步驟312具體根據以下公式處理:
6.根據權利要求5所述的方法,其特征在于,所述步驟32具體為:
7.一種通過語音驅動機器人嘴部開合的裝置,其特征在...
【專利技術屬性】
技術研發人員:魏宇飛,王傳輝,
申請(專利權)人:北京清飛科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。