• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    無人機械控制方法、電臺語音指令轉換方法及裝置制造方法及圖紙

    技術編號:29706489 閱讀:44 留言:0更新日期:2021-08-17 14:36
    一種無人機械控制方法、電臺語音指令轉換方法及裝置,控制方法包括:通過遠場的無線發(fā)射電臺將麥克風或對講機采集的電臺語音指令信息發(fā)送,對接收的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;對增益語音指令頻譜進行語音信道轉換,獲得到非電臺語音指令;對非電臺語音指令進行語音識別,獲得文字控制指令;文字控制指令,用于控制無人機械。實現利用遠場無線電臺傳輸的電臺語音指令,通過接收、去噪增強、信道轉換、識別獲得可以用于控制無人機械的文字控制指令,以方便對無人機械的控制,使用方便,直接通過語音控制、交互性更強。

    【技術實現步驟摘要】
    無人機械控制方法、電臺語音指令轉換方法及裝置
    本專利技術涉及無人機械控制與語音轉換識別
    ,尤其涉及一種無人機械控制方法、電臺語音指令轉換方法及裝置。
    技術介紹
    隨著科技進步及智能技術的發(fā)展,各類無人機械越來越多的被開發(fā)出來應用到各領域,比如無人機、無人車、無人船等。目前對于無人機械的控制主要有三種方式:方式1:采用手柄控制,這種方式只能做一些簡單的控制,例如:上下前后左右控制,而無法使用復雜指令進行控制、也無法實現一對多控制;方式2:通過鍵盤輸入指令控制,這種方式攜帶和使用均不方便,且在使用手柄控制時候無法使用鍵盤控制;方式3:通過可視化界面控制、把所有功能做成管理軟件,但是開發(fā)成本大、使用的學習成本大,且使用手柄控制時候無法使用可視化界面控制。上述這些方式均不能靈活方便的對無人機械進行控制。
    技術實現思路
    針對上述現有技術不足,本申請?zhí)峁┮环N無人機械控制方法、電臺語音指令轉換方法及裝置,應用于無人機械,實現利用遠場無線電臺傳輸的電臺語音指令,通過接收、去噪增強、信道轉換、識別獲得可以用于控制無人機械的文字控制指令,以方便對無人機械的控制,使用方便,直接通過語音控制、交互性更強。為了實現本專利技術的目的,擬采用以下方案:一種電臺語音指令轉換方法,應用于無人機械,包括:對接收的由遠場無線電臺發(fā)送的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;對增益語音指令頻譜進行語音信道轉換,獲得到非電臺語音指令;對非電臺語音指令進行語音識別,獲得文字控制指令;文字控制指令,用于控制無人機械。進一步,由遠場無線電臺發(fā)送的電臺語音指令,是在遠場處通過麥克風或對講機采集的、并由遠場無線電臺發(fā)送的電臺語音指令。進一步,去噪增強處理,包括:將接收的由遠場無線電臺發(fā)送的電臺語音指令按預設時間間隔長度分隔成N個小塊;N為整數,等于電臺語音指令的時長÷預設時間間隔長度;對小塊分別進行短時傅里葉變換處理,獲得N個第一頻譜;將N個第一頻譜分別輸入語音去噪增強網絡中進行處理,獲得N個去噪增強頻譜;將N個去噪增強頻譜組合成一個完整的增益語音指令頻譜。進一步,語音去噪增強網絡,包括7層CNN網絡、1層LSTM網絡、2層DNN網絡;第一頻譜具有第一預設頻譜寬度;通過語音去噪增強網絡對每個第一頻譜進行處理的步驟包括:通過7層CNN網絡對一個第一頻譜進行去噪增強處理,獲得多個具有第一預設頻譜寬度的第二頻譜;通過1層LSTM網絡對多個第二頻譜進行去噪增強處理,獲得一個具有第二預設頻譜寬度的第三頻譜;通過2層DNN網絡對一個第三頻譜進行去噪增強處理,獲得一個去噪增強頻譜,去噪增強頻譜具有第一預設頻譜寬度。進一步,對增益語音指令頻譜進行語音信道轉換,是將增益語音指令頻譜輸入信道轉換網絡進行信道轉換,以獲得到非電臺語音指令;信道轉換網絡,包括3層殘差網絡;進行信道轉換的步驟包括:通過第1層殘差網絡對輸入第1層殘差網絡的增益語音指令頻譜進行處理,輸出多個具有第一預設頻譜寬度的第一轉換音頻;通過第2層殘差網絡對輸入第2層殘差網絡的增益語音指令頻譜、第一轉換音頻進行結合處理,輸出多個具有第一預設頻譜寬度的第二轉換音頻;通過第3層殘差網絡對輸入第3層殘差網絡的增益語音指令頻譜、第一轉換音頻、第二轉換音頻進行結合處理,輸出一個具有第一預設頻譜寬度的非電臺語音指令。進一步,對非電臺語音指令進行語音識別,獲得文字控制指令,包括:判斷非電臺語音指令的時間長度與第一預設時間長度的大小:若非電臺語音指令的時間長度小于第一預設時間長度,則對非電臺語音指令進行補0操作,以使非電臺語音指令的時間長度與第一預設時間長度匹配,然后輸入語音識別網絡進行語音識別;若非電臺語音指令的時間長度等于第一預設時間長度,則直接輸入語音識別網絡進行語音識別;若非電臺語音指令的時間長度大于第一預設時間長度,則對非電臺語音指令進行切割,切割為若干與第一預設時間長度匹配的第一非電臺語音指令塊,以及至多一個小于第一預設時間長度的第二非電臺語音指令塊,將第二非電臺語音指令塊進行補0操作,以使第二非電臺語音指令塊與第一預設時間長度匹配,然后將第一非電臺語音指令塊以及補0操作后的第二非電臺語音指令塊輸入語音識別網絡進行語音識別。進一步,語音識別網絡,包括5層CNN網絡、1層BLSTM網絡、2層DNN網絡、CTC解碼網絡;語音識別網絡進行語音識別的步驟包括:通過5層CNN網絡對輸入的語音識別網絡的非電臺語音指令,或第一非電臺語音指令塊與第二非電臺語音指令塊進行特征提取處理,獲得具有第二預設時間長度和第三預設頻譜寬度的第一識別頻譜塊;通過1層BLSTM網絡對第一識別頻譜塊進行特征提取處理,獲得具有第二預設時間長度和第四預設頻譜寬度的第二識別頻譜塊;通過第1層DNN網絡對第二識別頻譜塊進行特征提取,獲得具有第一長度和第一寬度的特征向量;通過第2層DNN網絡對特征向量進行分類,獲得具有第一長度和第二寬度的文字識別結果;通過CTC解碼網絡對文字識別結果進行轉換,輸出大于等于0個漢字,以獲得文字控制指令。一種電臺語音指令轉換裝置,設于無人機械,包括:語音去噪增強模塊,用于對接收的由遠場無線電臺發(fā)送的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;語音信道轉換模塊,用于對增益語音指令頻譜進行語音信道轉換,獲得到非電臺語音指令;語音識別模塊,用于對非電臺語音指令進行語音識別,獲得文字控制指令,文字控制指令,用于控制無人機械。一種無人機械控制方法,其特征在于,包括:通過遠場的無線發(fā)射電臺將麥克風或對講機采集的電臺語音指令信息發(fā)送;通過設于無人機械的無線接收電臺接收無線發(fā)射電臺發(fā)送的電臺語音指令;通過設于無人機械的語音去噪增強模塊對電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;通過設于無人機械的語音信道轉換模塊對增益語音指令頻譜進行語音信道轉換,獲得到非電臺語音指令;通過設于無人機械的語音識別模塊對非電臺語音指令進行語音識別,獲得文字控制指令;根據文字控制指令控制無人機械。本專利技術的有益效果:1、可以將遠場電臺無線發(fā)送的電臺語音控制指令轉換為用于控制無人機械的文字指令,能夠方便對無人機械進行遠程控制,使用方便,實現了直接通過語音控制、交互性跟強。2、采用基于神經網絡的方式進行去噪增強處理、信道轉換處理以及語音識別處理,可以確保語音控制的識別效果精準有效,使識別獲得的文字指令能夠正確表達傳輸語音指令者的控制意愿。3、現有的識別模型主要采樣訓練加噪音方式來處理噪音問題,對于信噪比大于0db以為語音,識別率較高能到97%,但對于信噪比小于0db的語音,識別率較低,低于70%;本專利技術采用分割小塊,并進行短時傅里葉變換,然后利用7層CNN網絡+1層LS本文檔來自技高網...

    【技術保護點】
    1.一種電臺語音指令轉換方法,其特征在于,應用于無人機械,包括:/n對接收的由遠場無線電臺發(fā)送的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;/n對所述增益語音指令頻譜進行語音信道轉換,獲得到非電臺語音指令;/n對所述非電臺語音指令進行語音識別,獲得文字控制指令;所述文字控制指令,用于控制所述無人機械。/n

    【技術特征摘要】
    1.一種電臺語音指令轉換方法,其特征在于,應用于無人機械,包括:
    對接收的由遠場無線電臺發(fā)送的電臺語音指令進行去噪增強處理,獲得增益語音指令頻譜;
    對所述增益語音指令頻譜進行語音信道轉換,獲得到非電臺語音指令;
    對所述非電臺語音指令進行語音識別,獲得文字控制指令;所述文字控制指令,用于控制所述無人機械。


    2.根據權利要求1所述的電臺語音指令轉換方法,其特征在于,去噪增強處理,包括:
    將接收的由遠場無線電臺發(fā)送的電臺語音指令按預設時間間隔長度分隔成N個小塊;N為整數,N等于所述電臺語音指令的時長÷預設時間間隔長度;
    對所述小塊分別進行短時傅里葉變換處理,獲得N個第一頻譜;
    將所述N個第一頻譜分別輸入語音去噪增強網絡中進行處理,獲得N個去噪增強頻譜;
    將所述N個去噪增強頻譜組合成一個完整的增益語音指令頻譜。


    3.根據權利要求2所述的電臺語音指令轉換方法,其特征在于,所述語音去噪增強網絡,包括7層CNN網絡、1層LSTM網絡、2層DNN網絡;
    所述第一頻譜具有第一預設頻譜寬度;
    通過所述語音去噪增強網絡對每個第一頻譜進行處理的步驟包括:
    通過7層CNN網絡對一個第一頻譜進行去噪增強處理,獲得多個具有第一預設頻譜寬度的第二頻譜;
    通過1層LSTM網絡對所述多個第二頻譜進行去噪增強處理,獲得一個具有第二預設頻譜寬度的第三頻譜;
    通過2層DNN網絡對所述一個第三頻譜進行去噪增強處理,獲得一個去噪增強頻譜,所述去噪增強頻譜具有第一預設頻譜寬度。


    4.根據權利要求1所述的電臺語音指令轉換方法,其特征在于,對所述增益語音指令頻譜進行語音信道轉換,是將所述增益語音指令頻譜輸入信道轉換網絡進行信道轉換,以獲得到非電臺語音指令;所述信道轉換網絡,包括3層殘差網絡;
    進行信道轉換的步驟包括:
    通過第1層殘差網絡對輸入第1層殘差網絡的增益語音指令頻譜進行處理,輸出多個具有第一預設頻譜寬度的第一轉換音頻;
    通過第2層殘差網絡對輸入第2層殘差網絡的增益語音指令頻譜、第一轉換音頻進行結合處理,輸出多個具有第一預設頻譜寬度的第二轉換音頻;
    通過第3層殘差網絡對輸入第3層殘差網絡的增益語音指令頻譜、第一轉換音頻、第二轉換音頻進行結合處理,輸出一個具有第一預設頻譜寬度的非電臺語音指令。


    5.根據權利要求1所述的電臺語音指令轉換方法,其特征在于,對所述非電臺語音指令進行語音識別,獲得文字控制指令,包括:
    判斷所述非電臺語音指令的時間長度與第一預設時間長度的大?。?br>若所述非電臺語音指令的時間長度小于所述第一預設時間長度,則對所述非電臺語音指令進行補0操作,以使所述非電臺語音指令的時間長度與所述第一預設時間長度匹配,然后輸入語音識別網絡進行語音識別;
    若所述非電臺語音指令的時間長度等于所述第一預設時間長度,則直接輸入語音識別網絡進行語音識別;
    若所述非電臺語音指令的時間長度大于所述第一預設時間長度...

    【專利技術屬性】
    技術研發(fā)人員:陳英爽,鮑捷呂春
    申請(專利權)人:成都傅立葉電子科技有限公司,深圳市特發(fā)信息股份有限公司,
    類型:發(fā)明
    國別省市:四川;51

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 狠狠躁天天躁无码中文字幕图| 精品久久久久久无码人妻热| 国产精品ⅴ无码大片在线看 | 亚洲色无码一区二区三区| 国产爆乳无码视频在线观看| 中文字幕无码播放免费| 日日摸日日碰人妻无码| 无码H黄肉动漫在线观看网站| 亚洲AV无码一区二三区 | 亚洲AV无码一区二区一二区| 国产亚洲美日韩AV中文字幕无码成人 | av无码精品一区二区三区四区 | 日韩AV无码久久一区二区| 粉嫩大学生无套内射无码卡视频 | 亚洲中文无码av永久| 国产亚洲美日韩AV中文字幕无码成人| 精品无码人妻一区二区免费蜜桃| 永久免费无码日韩视频| 亚洲av永久无码| 亚洲AV成人噜噜无码网站| 丰满熟妇人妻Av无码区| 成年午夜无码av片在线观看| 小泽玛丽无码视频一区| 无码人妻精品一区二区三区9厂| 在线观看无码AV网站永久免费| 午夜人性色福利无码视频在线观看| 久久中文精品无码中文字幕 | 无码专区一va亚洲v专区在线| 亚洲AV无码专区在线电影成人| 精品国产V无码大片在线看| 无码人妻少妇久久中文字幕蜜桃| 亚洲日韩精品A∨片无码| 日韩人妻无码精品系列| 亚洲欧洲自拍拍偷午夜色无码| 久久久久亚洲AV无码专区桃色| 亚洲综合无码精品一区二区三区| 中文字幕无码日韩专区免费| 亚洲va无码va在线va天堂| 永久免费av无码入口国语片| 无码国产精品一区二区免费模式| 无码成人一区二区|