System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 18禁网站免费无遮挡无码中文,日韩精品无码免费专区网站,无码人妻精品一区二区三区夜夜嗨
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法技術(shù)方案

    技術(shù)編號:44500734 閱讀:7 留言:0更新日期:2025-03-04 18:09
    本發(fā)明專利技術(shù)屬于熱管理系統(tǒng)領(lǐng)域,提供了一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,包括:環(huán)境狀態(tài)接收、獎勵函數(shù)計算、策略優(yōu)化、決策校正、優(yōu)化目標函數(shù)和控制律構(gòu)建、溫度誤差計算、動作優(yōu)化以及器件調(diào)控。本發(fā)明專利技術(shù)通過融合智能體的策略優(yōu)化和傳統(tǒng)模型預(yù)測控制中的動作優(yōu)化,實現(xiàn)了冷卻系統(tǒng)中對風扇、水泵和閥門等設(shè)備的控制策略實時優(yōu)化,具備強化學(xué)習(xí)的適應(yīng)性及模型預(yù)測控制的穩(wěn)定性;通過設(shè)置智能體和反饋校正模塊,實現(xiàn)了根據(jù)系統(tǒng)的實際狀態(tài)調(diào)整預(yù)測模型參數(shù),提高了控制系統(tǒng)的魯棒性和適應(yīng)能力;通過滾動優(yōu)化輸出的控制律結(jié)合多次實時反饋和預(yù)測修正,實現(xiàn)了系統(tǒng)在動態(tài)變化中保持高效的溫度控制。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及熱管理系統(tǒng)領(lǐng)域,特別是涉及一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法


    技術(shù)介紹

    1、現(xiàn)有的熱管理系統(tǒng)通常依賴傳統(tǒng)的反饋控制方法,這種方法難以應(yīng)對復(fù)雜的多熱源系統(tǒng)動態(tài)變化。現(xiàn)有技術(shù)的控制手段主要依賴于模型預(yù)測控制,能夠通過預(yù)測未來的系統(tǒng)狀態(tài),實時優(yōu)化控制輸入。然而,模型預(yù)測控制方法對系統(tǒng)模型的依賴較大,在多熱源系統(tǒng)中可能出現(xiàn)控制精度不足或計算量過大的問題。此外,雖然傳統(tǒng)的mpc在工業(yè)控制和自動駕駛等領(lǐng)域已被廣泛應(yīng)用,但在復(fù)雜的溫度控制系統(tǒng)中,它難以適應(yīng)突發(fā)的工況變化,特別是在控制水泵、風扇等設(shè)備時,控制策略的靈活性和自適應(yīng)能力有限。


    技術(shù)實現(xiàn)思路

    1、為了克服現(xiàn)有技術(shù)的不足,本專利技術(shù)的目的是提供一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,實現(xiàn)對風扇、水泵和閥門等設(shè)備控制策略的實時優(yōu)化。

    2、為實現(xiàn)上述目的,本專利技術(shù)提供了如下方案:

    3、一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,包括:

    4、接收冷卻系統(tǒng)的反饋輸出,得到環(huán)境狀態(tài);

    5、根據(jù)所述環(huán)境狀態(tài)對獎勵函數(shù)進行計算,得到獎勵值;

    6、將所述環(huán)境狀態(tài)和所述獎勵值輸入到預(yù)設(shè)的智能體,得到權(quán)重系數(shù)操作決策;

    7、將所述權(quán)重系數(shù)操作決策輸入到反饋校正模塊進行調(diào)整,得到校正策略;

    8、構(gòu)建優(yōu)化目標函數(shù),并融合控制輸入的上下限約束、控制增量的約束以及系統(tǒng)輸出的約束,得到滾動優(yōu)化輸出的控制律;

    9、計算所述環(huán)境狀態(tài)中的溫度數(shù)據(jù)和目標溫度的誤差,得到溫度誤差;

    10、根據(jù)所述溫度誤差,利用所述控制律對所述校正策略進行動作優(yōu)化,得到優(yōu)化策略;

    11、利用所述優(yōu)化策略對所述冷卻系統(tǒng)內(nèi)的器件進行調(diào)控;所述器件包括:控制風扇,高溫水泵、低溫水泵、左電機閥門、右電機閥門、發(fā)電機閥門以及傳動油冷器閥門。

    12、優(yōu)選地,所述獎勵函數(shù)為:

    13、r(t)=-(α·∣tcurrent-ttarget∣+β·∣δt∣+γ·pfan+δ·ppump);

    14、其中,r(t)為所述獎勵值;tcurrent為當前系統(tǒng)溫度;ttarget為目標溫度;δt為溫度變化幅度;pfan為風扇功耗;ppump為水泵功耗;α為第一權(quán)重系數(shù);β為第二權(quán)重系數(shù);γ為第三權(quán)重系數(shù);δ為第四權(quán)重系數(shù)。

    15、優(yōu)選地,所述權(quán)重系數(shù)操作決策為:

    16、

    17、其中,j的取值范圍為1到p;p為最終的預(yù)測時刻;j代表第j時刻;θk+j為第五權(quán)重系數(shù);dk+j-1為歷史數(shù)據(jù)集;t為歷史數(shù)據(jù)數(shù)量;pθ(ai|si)表示當前狀態(tài)下的決策的概率;pθ′(ai|si)表示更新狀態(tài)下的決策的概率;aθ′表示在當前狀態(tài)和操作下的優(yōu)勢;g()為幅度限制函數(shù);st為環(huán)境狀態(tài);at為操作風扇;ε為噪聲調(diào)整參數(shù)。

    18、優(yōu)選地,所述優(yōu)化目標函數(shù)為:

    19、

    20、

    21、其中,ym(k+i)為系統(tǒng)輸出;yr(k+i)為期望輸出;ufan(k+i|k)為風扇控制輸入;upump(k+i|k)為水泵控制輸入;uvalve(k+i|k)為閥門控制輸入;o為預(yù)測時域的長度;n為控制優(yōu)化的時域長度。

    22、優(yōu)選地,所述控制輸入的上下限約束的表達式為:

    23、umin≤u(k+1|k)≤umax;

    24、所述控制增量的約束的表達式為:

    25、△umin≤△u(k+1|k)≤△umax;

    26、所述系統(tǒng)輸出的約束的表達式為:

    27、ymin≤k(k+1|k)≤ymax;

    28、其中,umin為輸出下限;u(k+1|k)為控制輸出;umax為輸出上限;△umin為輸出增量的下限;△u(k+1|k)為所述控制輸出的增量;△umax為輸出增量的上限;ymin為約束下限;k(k+1|k)為系統(tǒng)輸出約束;ymax為約束上限。

    29、優(yōu)選地,所述控制律為:

    30、

    31、其中,uk+1表示下一時刻的控制輸入;uk表示當前時刻的控制輸入;ai和bi分別為第一約束條件參數(shù)和第二約束條件參數(shù);pi是ai在擾動方向p上的有效分量;f為調(diào)節(jié)參數(shù)。

    32、本專利技術(shù)公開了以下技術(shù)效果:

    33、本專利技術(shù)提供了一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,通過融合智能體的策略優(yōu)化和傳統(tǒng)模型預(yù)測控制中的動作優(yōu)化,解決了傳統(tǒng)方法僅采用模型預(yù)測控制導(dǎo)致對系統(tǒng)模型的依賴較大的缺陷,實現(xiàn)了對風扇、水泵和閥門等設(shè)備的控制策略實時優(yōu)化;通過設(shè)置智能體和反饋校正模塊,解決了傳統(tǒng)模型預(yù)測控制適用性較差的問題,實現(xiàn)了根據(jù)系統(tǒng)的實際狀態(tài)調(diào)整預(yù)測模型參數(shù);通過滾動優(yōu)化輸出的控制律結(jié)合多次實時反饋和預(yù)測修正,解決了傳統(tǒng)模型預(yù)測控制難以適應(yīng)突發(fā)的工況變化的缺陷,實現(xiàn)了系統(tǒng)在動態(tài)變化中保持高效的溫度控制。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述獎勵函數(shù)為:

    3.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述權(quán)重系數(shù)操作決策為:

    4.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述優(yōu)化目標函數(shù)為:

    5.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述控制輸入的上下限約束的表達式為:

    6.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述控制律為:

    【技術(shù)特征摘要】

    1.一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述獎勵函數(shù)為:

    3.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述權(quán)重系數(shù)操作決策為:

    4.根據(jù)權(quán)利要求...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:鄭瀟嚴宇超趙俊良孫曉霞劉震濤沈麗麗
    申請(專利權(quán))人:浙江大學(xué)
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕无码久久久| 国产精品白浆无码流出| 无码精品不卡一区二区三区| 一夲道dvd高清无码| 无码精品一区二区三区| AV无码小缝喷白浆在线观看| 亚洲AV无码男人的天堂| 亚洲中久无码不卡永久在线观看| 人妻少妇精品无码专区二区| 国产成人无码精品久久久免费| 无码国产精品一区二区免费式影视| julia无码人妻中文字幕在线 | 成人无码A区在线观看视频| 精品人无码一区二区三区| 亚洲国产精品无码久久久久久曰| 曰产无码久久久久久精品| 色偷偷一区二区无码视频| 亚洲欧洲无码AV电影在线观看| 精品人妻中文无码AV在线| 国产乱妇无码大片在线观看| 亚洲级αV无码毛片久久精品| 亚洲国产成人精品无码久久久久久综合| 99无码人妻一区二区三区免费| 色窝窝无码一区二区三区色欲| 中文字幕精品无码一区二区三区| 精品无码国产污污污免费网站国产| 亚洲精品av无码喷奶水糖心| 亚洲AV无码一区二区大桥未久| 亚洲人成网亚洲欧洲无码| 亚洲av无码片区一区二区三区| 无码av免费一区二区三区| 亚洲AV无码国产精品麻豆天美| 国产50部艳色禁片无码| 蜜桃臀AV高潮无码| 精品爆乳一区二区三区无码av| 久久Av无码精品人妻系列| 99无码人妻一区二区三区免费| 中文字幕人成无码人妻综合社区| 无码一区二区三区爆白浆| (无码视频)在线观看 | 亚洲av无码成人黄网站在线观看|