System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于新能源汽車與人工智能的交叉領域,涉及一種面向混合動力汽車的深度強化學習型具身智能方法。
技術介紹
1、新能源汽車,尤其是混合動力汽車,在推動能源轉型和緩解能源危機中發揮著重要作用。混合動力汽車結合內燃機與電動驅動系統的優勢,既滿足長途行駛需求,又能在城市中實現更低排放。
2、人工智能技術,特別是深度學習和強化學習的進步,推動ai時代的發展,但在真實駕駛環境中,深度強化學習面臨仿真與現實之間的差距、可信度和樣本效率等挑戰。與此同時,作為一種最新的概念,具身智能是指將智能體的感知、行動與其物理身體和環境緊密結合的智能系統。與傳統人工智能不同,具身智能強調在真實世界中交互與學習,利用傳感器獲取環境信息,并通過實際動作進行反饋與調整。它通常集成多模態感知能力,使智能體能夠在動態環境中實時決策,從而在機器人技術、自動駕駛、智能制造等領域發揮重要作用。通過這種方式,具身智能將能夠更好地適應復雜環境,增強與人類的協作能力。
3、因此,亟需一種深度強化學習型具身智能方法來增強混合動力汽車的智能駕駛技術。通過深度強化學習算法訓練“alpha?hev具身智能模型”,專注于節能駕駛,通過提升環境感知和優化駕駛決策,推動智能化節能駕駛技術的發展。
技術實現思路
1、有鑒于此,本專利技術的目的在于提供一種面向混合動力汽車的深度強化學習型具身智能方法,針對新能源混合動力汽車與人工智能技術的協同促進與發展,通過深度強化學習算法訓練“alpha?hev具身智能模型”,專注于節
2、為達到上述目的,本專利技術提供如下技術方案:
3、一種面向混合動力汽車的深度強化學習型具身智能方法,具體包括以下步驟:
4、s1:自定義離線訓練與建模在線測試方案;
5、通過搭載全球定位系統、慣性測量單元和單目攝像頭的車輛,采集來自真實世界的道路軌跡數據;隨后生成xdor格式的路點文件,創建自定義地圖,作為數字孿生的擬真測試場景;同時將80%的真實坡度用于matlab的curved?road官方地圖作為訓練場景;
6、s2:構建實時駕駛環境bev感知方案;
7、在自動駕駛仿真軟件中加載離線訓練場景與自定義測試地圖,并且根據nuscenes數據集配置攝像機;完成場景、車輛及傳感器建模后,基于bev?fusion算法對關鍵交通要素進行分割與檢測,提升環境感知與檢測精度,感知結果為深度強化學習型具身智能提供基礎特征;
8、s3:訓練“alpha?hev具身智能模型”;
9、通過bev?fusion算法獲得高維camera?bev張量,利用深度強化學習算法訓練“alpha?hev具身智能模型”;該模型專注整車節能駕駛的四項核心學習任務,包括自適應巡航控制、車道輔助保持、能量管理策略和變速器換擋策略;
10、s4:驗證“alpha?hev具身智能模型”;
11、在完成離線訓練后,在測試場景直接驗證“alpha?hev具身智能模型”的適用性與可靠性,同時維持評論家網絡的在線更新效果;通過創建守護者網絡應對陌生環境,并測試其對實時狀態的判別和可靠性評估;同時,在云端實現場景重構后,采用模仿學習快速擬合控制命令,以增強新場景的訓練。
12、進一步,步驟s1中,自定義離線訓練與建模在線測試方案,具體包括以下步驟:
13、s11:通過搭載全球定位系統、慣性測量單元以及單目攝像頭等傳感設備的車輛,實際采集來自真實世界的軌跡,即目標路徑中關于經緯度、海拔以及駕駛過程中的橫擺角ψ、俯仰角θ與側傾角φ等數據;
14、例如從重慶市沙坪壩區重慶大學a區到重慶大學虎溪校區的目標路徑,獲得關于經緯度、海拔以及駕駛過程中的橫擺角ψ、俯仰角θ與側傾角φ等數據;
15、s12:基于實測的目標路徑數據,經過數據處理與坐標系轉換后,得到以米為單位的實際數據;由于gps在隧道、橋梁等人為改造后的地形存在明顯且嚴重的測量偏差,因此以俯仰角軌跡數據替代原先需求的坡度數據,并利用matlab生成xdor格式的路點文件;
16、s13:采用roadrunner建模軟件,完整增加額外車道、定義路面類型、設置道路邊界以及繪制車道線等道路特征;隨后,利用unreal?engine繪制地形及其他標志性參照物;通過打包操作后,將其作為自定義地圖加載至自動駕駛仿真軟件carla中,并以此作為面向混合動力汽車的深度強化學習型具身智能方案的測試場景;同時,將80%的真實坡度加載到malab官方地圖curved?road的路徑軌跡,并以此作為訓練場景;此時,在訓練場景與測試場景之間差異性主要體現在道路坡度、曲率與最高車速等狀態特征。
17、進一步,步驟s2中,構建實時駕駛環境bev感知方案,具體包括以下步驟:
18、s21:在carla中不僅加載來自真實世界的自定義地圖模型,并且按照nuscenes數據集的傳感器采集設備規格,按照數據集中單目rgb相機的內外參布置攝像機的安裝位,具體外參數如下式所示;如果對深度相機、激光雷達與毫米波雷達等設備有研究與應用需求,根據整車坐標系的參考位置安放到相應位置即可,以便后續研發多模態融合的感知算法;
19、
20、s22:在完成針對場景、車輛以及傳感器等建模與加載后,基于bev?fusion算法進行當前駕駛場景中關鍵交通要素的分割與檢測;bev?fusion算法通過將來自不同傳感器的數據映射到鳥瞰視角,能夠有效融合多種視角的信息,提供更全面的環境感知;這種方法不僅可以提高對周圍環境的理解,還能準確識別并定位道路、障礙物、行人及其他交通參與者。通過深度學習模型對處理后的數據進行特征提取和分割,將關鍵交通要素從背景中分離;此過程中的特征融合策略,使算法能夠克服單一傳感器數據的局限性,實現更高的檢測精度與魯棒性。最終,生成的感知結果將作為后續深度強化學習型控制策略模型的基礎輸入特征。這些特征不僅包括位置、速度等動態信息,還涵蓋交通標志、車道線及周圍環境的變化,為智能駕駛系統提供更為準確和豐富的決策依據,從而提升具身智能模型的安全性和可靠性。
21、進一步,步驟s3中,訓練“alpha?hev具身智能模型”,具體包括以下步驟:
22、s31:在bev?fusion算法完成環境感知后獲得四維空間張量,其中每個維度分別代表批量樣本數、特征層數目、特征層長度與特征層寬度;此時,以深度強化學習算法為開發工具,以智能混合動力汽車為研發對象,以整車節能駕駛為學習任務,訓練集成ai經驗型駕駛員與ai專業型工程師于一身的“alpha?hev具身智能模型”;其中包括4項核心任務:自適應巡航控制(acc)、車道輔助保持(lka)、能量管理策略(ems)和變速器換擋策略(tss)等;
23、s32:基于深度強化學習的自適應巡航控制訓練理念采用混合動作策略,將其與基于比例-積分本文檔來自技高網...
【技術保護點】
1.一種面向混合動力汽車的深度強化學習型具身智能方法,其特征在于,該方法具體包括以下步驟:
2.根據權利要求1所述的深度強化學習型具身智能方法,其特征在于,步驟S1中,自定義離線訓練與建模在線測試方案,具體包括以下步驟:
3.根據權利要求1所述的深度強化學習型具身智能方法,其特征在于,步驟S2中,構建實時駕駛環境BEV感知方案,具體包括以下步驟:
4.根據權利要求1所述的深度強化學習型具身智能方法,其特征在于,步驟S3中,訓練“Alpha?HEV具身智能模型”,具體包括以下步驟:
5.根據權利要求1所述的深度強化學習型具身智能方法,其特征在于,步驟S4中,驗證“Alpha?HEV具身智能模型”,具體包括以下步驟:
【技術特征摘要】
1.一種面向混合動力汽車的深度強化學習型具身智能方法,其特征在于,該方法具體包括以下步驟:
2.根據權利要求1所述的深度強化學習型具身智能方法,其特征在于,步驟s1中,自定義離線訓練與建模在線測試方案,具體包括以下步驟:
3.根據權利要求1所述的深度強化學習型具身智能方法,其特征在于,步驟s2中,構建實時駕駛...
【專利技術屬性】
技術研發人員:唐小林,陳佳信,王猛,楊為,劉宇杰,唐小麗,李佳承,
申請(專利權)人:重慶大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。