• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種用于飛機智能體機動決策的數據處理方法及裝置制造方法及圖紙

    技術編號:34823454 閱讀:31 留言:0更新日期:2022-09-03 20:35
    本發(fā)明專利技術公開了一種用于飛機智能體機動決策的數據處理方法及裝置,該方法包括:啟動仿真推演平臺的仿真推演引擎;從仿真推演平臺獲取環(huán)境狀態(tài)信息;環(huán)境狀態(tài)信息包括若干個仿真實體;判斷環(huán)境狀態(tài)信息是否滿足仿真終止條件,得到第一判斷結果;仿真終止條件與仿真實體的狀態(tài)標志相關;狀態(tài)標志用于表征仿真實體在仿真推演平臺中的可識別情況;當第一判斷結果為否時,根據環(huán)境狀態(tài)信息,確定出仿真推演指令信息;仿真推演指令信息包括若干個仿真推演指令;仿真推演指令信息用于指示仿真推演平臺的仿真推演。可見,本發(fā)明專利技術有利于解決周期過短使飛機操作更換過于頻繁所造成的頻繁抖動,以及周期過長使飛機動作缺乏足夠的靈活性而導致的戰(zhàn)機貽誤。導致的戰(zhàn)機貽誤。導致的戰(zhàn)機貽誤。

    【技術實現(xiàn)步驟摘要】
    一種用于飛機智能體機動決策的數據處理方法及裝置


    [0001]本專利技術涉及數據處理
    ,尤其涉及一種用于飛機智能體機動決策的數據處理方法及裝置。

    技術介紹

    [0002]現(xiàn)有的飛機機動決策問題解決方案主要是在強化學習的框架下,分析表征空戰(zhàn)態(tài)勢的主要因素,建立空戰(zhàn)優(yōu)勢函數并以此作為強化學習回報值的基礎,并設計空戰(zhàn)機動決策的強化學習模型(DQN、TD差分等),對空戰(zhàn)機動決策的狀態(tài)空間進行歸一化處理將其作為強化學習的狀態(tài)輸入,并將飛機的機動動作離散化為左右上下等單步動作作為強化學習的基本動作空間,通過迭代優(yōu)化針對于飛機的當前狀態(tài)基于一個最優(yōu)的動作指令。針對于單步動作指令,由于對飛機的連續(xù)動作難以表達,現(xiàn)有的方法均基于離散的動作空間進行決策,設置固定的步長進行決策,容易出現(xiàn)由于步長過小會使得飛機決策過于頻繁而造成的與實際不符的抖動,或者由于補償過大造成飛機決策過程中的戰(zhàn)機貽誤等問題。因此,提供一種用于飛機智能體機動決策的數據處理方法及裝置,以解決周期過短使飛機操作更換過于頻繁所造成的頻繁抖動,以及周期過長使飛機動作缺乏足夠的靈活性而導致的戰(zhàn)機貽誤顯得尤為重要。

    技術實現(xiàn)思路

    [0003]本專利技術所要解決的技術問題在于,提供一種用于飛機智能體機動決策的數據處理方法及裝置,能夠通過對環(huán)境狀態(tài)信息的綜合處理得到用于指示仿真推演平臺進行仿真推演的仿真推演指令,有利于解決周期過短使飛機操作更換過于頻繁所造成的頻繁抖動,以及周期過長使飛機動作缺乏足夠的靈活性而導致的戰(zhàn)機貽誤。
    [0004]為了解決上述技術問題,本專利技術實施例第一方面公開了一種用于飛機智能體機動決策的數據處理方法,所述方法包括:
    [0005]啟動仿真推演平臺的仿真推演引擎;
    [0006]從所述仿真推演平臺獲取環(huán)境狀態(tài)信息;所述環(huán)境狀態(tài)信息包括若干個仿真實體;
    [0007]判斷所述環(huán)境狀態(tài)信息是否滿足仿真終止條件,得到第一判斷結果;所述仿真終止條件與所述仿真實體的狀態(tài)標志相關;所述狀態(tài)標志用于表征所述仿真實體在所述仿真推演平臺中的可識別情況;
    [0008]當所述第一判斷結果為否時,根據所述環(huán)境狀態(tài)信息,確定出仿真推演指令信息;所述仿真推演指令信息包括若干個仿真推演指令;所述仿真推演指令信息用于指示所述仿真推演平臺的仿真推演。
    [0009]作為一種可選的實施方式,在本專利技術實施例第一方面中,所述環(huán)境狀態(tài)信息包括當前推進指令信息;
    [0010]根據所述環(huán)境狀態(tài)信息,確定出仿真推演指令信息,包括:
    [0011]根據所述環(huán)境狀態(tài)信息,確定出宏動作指令信息;
    [0012]根據所述環(huán)境狀態(tài)信息,確定出規(guī)則動作指令信息;
    [0013]對所述當前推進指令信息、所述宏動作指令信息和所述規(guī)則動作指令信息進行融合處理,得到仿真推演指令信息。
    [0014]作為一種可選的實施方式,在本專利技術實施例第一方面中,所述根據所述環(huán)境狀態(tài)信息,確定出規(guī)則動作指令信息,包括:
    [0015]判斷所述環(huán)境狀態(tài)信息是否滿足規(guī)則動作條件,得到第二判斷結果;
    [0016]當所述第二判斷結果為是時,確定規(guī)則動作指令信息為發(fā)射指令;
    [0017]當所述第二判斷結果為否時,確定所述規(guī)則動作指令信息為規(guī)則動作空缺信息;所述規(guī)則動作空缺信息表征不需要進行規(guī)則動作的仿真操作。
    [0018]作為一種可選的實施方式,在本專利技術實施例第一方面中,所述根據所述環(huán)境狀態(tài)信息,確定出宏動作指令信息,包括:
    [0019]判斷所述環(huán)境狀態(tài)信息是否滿足觸發(fā)條件,得到第三判斷結果;
    [0020]當所述第三判斷結果為是時,對所述環(huán)境狀態(tài)信息進行格式轉換和數據篩選處理,得到態(tài)勢狀態(tài)信息;所述態(tài)勢狀態(tài)信息包括紅藍雙方的距離信息、紅藍雙方的角度信息、藍方導彈與紅方飛機的距離信息以及角度信息、紅方飛機被鎖定的信息;
    [0021]對所述態(tài)勢狀態(tài)信息進行計算處理,得到宏動作指令信息。
    [0022]作為一種可選的實施方式,在本專利技術實施例第一方面中,所述對所述態(tài)勢狀態(tài)信息進行計算處理,得到宏動作指令信息,包括:
    [0023]利用所述態(tài)勢狀態(tài)信息對預設的表演者網絡進行訓練,得到目標狀態(tài)信息網絡;
    [0024]利用所述目標狀態(tài)信息網絡對所述態(tài)勢狀態(tài)信息進行計算處理,得到宏動作指令信息。
    [0025]作為一種可選的實施方式,在本專利技術實施例第一方面中,所述利用所述態(tài)勢狀態(tài)信息對預設的表演者網絡進行訓練,得到目標狀態(tài)信息網絡,包括:
    [0026]獲取預設的表演者網絡;
    [0027]將所述態(tài)勢狀態(tài)信息輸入所述表演者網絡,得到網絡采樣動作信息;所述網絡采用動作信息包括均值信息和方差信息;
    [0028]根據所述網絡采樣動作信息,確定出樣本池數據信息;所述樣本池數據信息包括若干個樣本池數據;所述樣本池數據包括第一狀態(tài)信息、動作信息、獎勵信息、第二狀態(tài)信息;
    [0029]對所述樣本池數據信息進行劃區(qū)處理,得到樣本池區(qū)塊信息;所述樣本池區(qū)塊信息包括若干個樣本池區(qū)塊;所述樣本池區(qū)塊包括若干個樣本池數據;
    [0030]從所述樣本池數據信息中篩選出目標狀態(tài)信息;所述目標狀態(tài)信息為所述樣本池數據信息中最后一個步長計算得到的第二狀態(tài)信息;
    [0031]利用預設的評價者網絡對所述目標狀態(tài)信息進行處理,得到狀態(tài)值信息;
    [0032]利用預設的折扣獎勵模型對所述狀態(tài)值信息進行計算處理,得到折扣獎勵信息;
    [0033]從所述樣本池區(qū)塊信息中篩選出第一目標樣本池區(qū)塊信息;
    [0034]對所述第一目標樣本池區(qū)塊信息和所述折扣獎勵信息進行計算處理,得到優(yōu)勢函數信息;
    [0035]從所述樣本池區(qū)塊信息中篩選出第二目標樣本池區(qū)塊信息;
    [0036]利用所述第二目標樣本池區(qū)塊信息對所述表演者網絡進行更新處理,得到當前表演者網絡;
    [0037]確定所述表演者網絡為歷史表演者網絡;
    [0038]對所述樣本池數據信息、所述當前表演者網絡和所述歷史表演者網絡進行計算處理,得到重要性采樣率信息;
    [0039]對所述重要性采樣率信息、所述優(yōu)勢函數信息和所述網絡采樣動作信息進行計算處理,得到損失函數值信息;
    [0040]判斷所述損失函數值信息是否滿足第一終止條件,得到第一終止判斷結果;
    [0041]當所述第一終止判斷結果為否時,觸發(fā)執(zhí)行所述從所述樣本池區(qū)塊信息中篩選出第二目標樣本池區(qū)塊信息;
    [0042]當所述第一終止判斷結果為是時,根據所述折扣獎勵信息,確定出折扣獎勵變化信息;
    [0043]判斷所述折扣獎勵變化信息是否滿足第二終止條件,得到第二終止判斷結果;
    [0044]當所述第二終止判斷結果為否時,利用所述當前表演者網絡對所述表演者網絡進行更新;觸發(fā)執(zhí)行所述將所述態(tài)勢狀態(tài)信息輸入所述表演者網絡,得到網絡采樣動作信息;
    [0045]當所述第二終止判斷結果為是時,確定所述當前表演者網絡為目標狀態(tài)信息網絡。
    [0046]作為一本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種用于飛機智能體機動決策的數據處理方法,其特征在于,所述方法包括:啟動仿真推演平臺的仿真推演引擎;從所述仿真推演平臺獲取環(huán)境狀態(tài)信息;所述環(huán)境狀態(tài)信息包括若干個仿真實體;判斷所述環(huán)境狀態(tài)信息是否滿足仿真終止條件,得到第一判斷結果;所述仿真終止條件與所述仿真實體的狀態(tài)標志相關;所述狀態(tài)標志用于表征所述仿真實體在所述仿真推演平臺中的可識別情況;當所述第一判斷結果為否時,根據所述環(huán)境狀態(tài)信息,確定出仿真推演指令信息;所述仿真推演指令信息包括若干個仿真推演指令;所述仿真推演指令信息用于指示所述仿真推演平臺的仿真推演。2.根據權利要求1所述的用于飛機智能體機動決策的數據處理方法,其特征在于,所述環(huán)境狀態(tài)信息包括當前推進指令信息;所述根據所述環(huán)境狀態(tài)信息,確定出仿真推演指令信息,包括:根據所述環(huán)境狀態(tài)信息,確定出宏動作指令信息;根據所述環(huán)境狀態(tài)信息,確定出規(guī)則動作指令信息;對所述當前推進指令信息、所述宏動作指令信息和所述規(guī)則動作指令信息進行融合處理,得到仿真推演指令信息。3.根據權利要求2所述的用于飛機智能體機動決策的數據處理方法,其特征在于,所述根據所述環(huán)境狀態(tài)信息,確定出規(guī)則動作指令信息,包括:判斷所述環(huán)境狀態(tài)信息是否滿足規(guī)則動作條件,得到第二判斷結果;當所述第二判斷結果為是時,確定規(guī)則動作指令信息為發(fā)射指令;當所述第二判斷結果為否時,確定所述規(guī)則動作指令信息為規(guī)則動作空缺信息;所述規(guī)則動作空缺信息表征不需要進行規(guī)則動作的仿真操作。4.根據權利要求2所述的用于飛機智能體機動決策的數據處理方法,其特征在于,所述根據所述環(huán)境狀態(tài)信息,確定出宏動作指令信息,包括:判斷所述環(huán)境狀態(tài)信息是否滿足觸發(fā)條件,得到第三判斷結果;當所述第三判斷結果為是時,對所述環(huán)境狀態(tài)信息進行格式轉換和數據篩選處理,得到態(tài)勢狀態(tài)信息;所述態(tài)勢狀態(tài)信息包括紅藍雙方的距離信息、紅藍雙方的角度信息、藍方導彈與紅方飛機的距離信息以及角度信息、紅方飛機被鎖定的信息;對所述態(tài)勢狀態(tài)信息進行計算處理,得到宏動作指令信息。5.根據權利要求4所述的用于飛機智能體機動決策的數據處理方法,其特征在于,所述對所述態(tài)勢狀態(tài)信息進行計算處理,得到宏動作指令信息,包括:利用所述態(tài)勢狀態(tài)信息對預設的表演者網絡進行訓練,得到目標狀態(tài)信息網絡;利用所述目標狀態(tài)信息網絡對所述態(tài)勢狀態(tài)信息進行計算處理,得到宏動作指令信息。6.根據權利要求5所述的用于飛機智能體機動決策的數據處理方法,其特征在于,所述利用所述態(tài)勢狀態(tài)信息對預設的表演者網絡進行訓練,得到目標狀態(tài)信息網絡,包括:獲取預設的表演者網絡;將所述態(tài)勢狀態(tài)信息輸入所述表演者網絡,得到網絡采樣動作信息;所述網絡采用動作信息包括均值信息和方差信息;
    根據所述網絡采樣動作信息,確定出樣本池數據信息;所述樣本池數據信息包括若干個樣本池數據;所述樣本池數據包括第一狀態(tài)信息、動作信息、獎勵信息、第二狀態(tài)信息;對所述樣本池數據信息進行劃區(qū)處理,得到樣本池區(qū)塊信息;所述樣本池區(qū)塊信息包括若干個樣本池區(qū)塊;所述樣本池區(qū)塊包括若干個樣本池數據;從所述樣本池數據信息中篩選出目標狀態(tài)信息;所述目標狀態(tài)信息為所述樣本池數據信息中最后一個步長計算得到...

    【專利技術屬性】
    技術研發(fā)人員:陳敏杰孫方義張柯
    申請(專利權)人:北京鼎成智造科技有限公司
    類型:發(fā)明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久男人Av资源网站无码软件| 亚洲AV无码乱码国产麻豆| 久久亚洲AV成人无码电影| 亚洲熟妇无码一区二区三区| 色欲AV无码一区二区三区| 国产网红无码精品视频| 日韩毛片无码永久免费看| 人妻丝袜中文无码av影音先锋专区| 精品国产一区二区三区无码| H无码精品3D动漫在线观看| 亚洲性无码一区二区三区| 国产成人无码一区二区三区 | 免费VA在线观看无码| 无码成A毛片免费| 日韩成人无码中文字幕| 亚洲爆乳无码专区www| 精品亚洲成在人线AV无码| 亚洲色无码一区二区三区| 国产精品xxxx国产喷水亚洲国产精品无码久久一区 | 精品无码免费专区毛片| 国产在线无码视频一区二区三区| 无翼乌工口肉肉无遮挡无码18| 白嫩少妇激情无码| 国产乱妇无码大片在线观看| 日韩精品无码专区免费播放| 亚洲一区二区三区无码中文字幕| 亚洲av无码国产精品色在线看不卡 | 欧洲黑大粗无码免费| 亚洲精品GV天堂无码男同| 精品视频无码一区二区三区| 无码av最新无码av专区| 日韩精品人妻系列无码专区| 久久精品岛国av一区二区无码| 亚洲国产精品无码久久久不卡| 亚洲人成影院在线无码按摩店| 中文字幕人妻无码一区二区三区| 本免费AV无码专区一区| 亚洲一区二区三区无码中文字幕| 国产精品无码无片在线观看| 国产Av激情久久无码天堂| 色偷偷一区二区无码视频|