System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 18禁网站免费无遮挡无码中文,日韩精品无码免费专区网站,无码人妻精品一区二区三区夜夜嗨
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法技術(shù)方案

    技術(shù)編號:44500734 閱讀:7 留言:0更新日期:2025-03-04 18:09
    本發(fā)明專利技術(shù)屬于熱管理系統(tǒng)領(lǐng)域,提供了一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,包括:環(huán)境狀態(tài)接收、獎勵函數(shù)計算、策略優(yōu)化、決策校正、優(yōu)化目標函數(shù)和控制律構(gòu)建、溫度誤差計算、動作優(yōu)化以及器件調(diào)控。本發(fā)明專利技術(shù)通過融合智能體的策略優(yōu)化和傳統(tǒng)模型預(yù)測控制中的動作優(yōu)化,實現(xiàn)了冷卻系統(tǒng)中對風扇、水泵和閥門等設(shè)備的控制策略實時優(yōu)化,具備強化學(xué)習(xí)的適應(yīng)性及模型預(yù)測控制的穩(wěn)定性;通過設(shè)置智能體和反饋校正模塊,實現(xiàn)了根據(jù)系統(tǒng)的實際狀態(tài)調(diào)整預(yù)測模型參數(shù),提高了控制系統(tǒng)的魯棒性和適應(yīng)能力;通過滾動優(yōu)化輸出的控制律結(jié)合多次實時反饋和預(yù)測修正,實現(xiàn)了系統(tǒng)在動態(tài)變化中保持高效的溫度控制。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及熱管理系統(tǒng)領(lǐng)域,特別是涉及一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法


    技術(shù)介紹

    1、現(xiàn)有的熱管理系統(tǒng)通常依賴傳統(tǒng)的反饋控制方法,這種方法難以應(yīng)對復(fù)雜的多熱源系統(tǒng)動態(tài)變化。現(xiàn)有技術(shù)的控制手段主要依賴于模型預(yù)測控制,能夠通過預(yù)測未來的系統(tǒng)狀態(tài),實時優(yōu)化控制輸入。然而,模型預(yù)測控制方法對系統(tǒng)模型的依賴較大,在多熱源系統(tǒng)中可能出現(xiàn)控制精度不足或計算量過大的問題。此外,雖然傳統(tǒng)的mpc在工業(yè)控制和自動駕駛等領(lǐng)域已被廣泛應(yīng)用,但在復(fù)雜的溫度控制系統(tǒng)中,它難以適應(yīng)突發(fā)的工況變化,特別是在控制水泵、風扇等設(shè)備時,控制策略的靈活性和自適應(yīng)能力有限。


    技術(shù)實現(xiàn)思路

    1、為了克服現(xiàn)有技術(shù)的不足,本專利技術(shù)的目的是提供一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,實現(xiàn)對風扇、水泵和閥門等設(shè)備控制策略的實時優(yōu)化。

    2、為實現(xiàn)上述目的,本專利技術(shù)提供了如下方案:

    3、一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,包括:

    4、接收冷卻系統(tǒng)的反饋輸出,得到環(huán)境狀態(tài);

    5、根據(jù)所述環(huán)境狀態(tài)對獎勵函數(shù)進行計算,得到獎勵值;

    6、將所述環(huán)境狀態(tài)和所述獎勵值輸入到預(yù)設(shè)的智能體,得到權(quán)重系數(shù)操作決策;

    7、將所述權(quán)重系數(shù)操作決策輸入到反饋校正模塊進行調(diào)整,得到校正策略;

    8、構(gòu)建優(yōu)化目標函數(shù),并融合控制輸入的上下限約束、控制增量的約束以及系統(tǒng)輸出的約束,得到滾動優(yōu)化輸出的控制律;

    9、計算所述環(huán)境狀態(tài)中的溫度數(shù)據(jù)和目標溫度的誤差,得到溫度誤差;

    10、根據(jù)所述溫度誤差,利用所述控制律對所述校正策略進行動作優(yōu)化,得到優(yōu)化策略;

    11、利用所述優(yōu)化策略對所述冷卻系統(tǒng)內(nèi)的器件進行調(diào)控;所述器件包括:控制風扇,高溫水泵、低溫水泵、左電機閥門、右電機閥門、發(fā)電機閥門以及傳動油冷器閥門。

    12、優(yōu)選地,所述獎勵函數(shù)為:

    13、r(t)=-(α·∣tcurrent-ttarget∣+β·∣δt∣+γ·pfan+δ·ppump);

    14、其中,r(t)為所述獎勵值;tcurrent為當前系統(tǒng)溫度;ttarget為目標溫度;δt為溫度變化幅度;pfan為風扇功耗;ppump為水泵功耗;α為第一權(quán)重系數(shù);β為第二權(quán)重系數(shù);γ為第三權(quán)重系數(shù);δ為第四權(quán)重系數(shù)。

    15、優(yōu)選地,所述權(quán)重系數(shù)操作決策為:

    16、

    17、其中,j的取值范圍為1到p;p為最終的預(yù)測時刻;j代表第j時刻;θk+j為第五權(quán)重系數(shù);dk+j-1為歷史數(shù)據(jù)集;t為歷史數(shù)據(jù)數(shù)量;pθ(ai|si)表示當前狀態(tài)下的決策的概率;pθ′(ai|si)表示更新狀態(tài)下的決策的概率;aθ′表示在當前狀態(tài)和操作下的優(yōu)勢;g()為幅度限制函數(shù);st為環(huán)境狀態(tài);at為操作風扇;ε為噪聲調(diào)整參數(shù)。

    18、優(yōu)選地,所述優(yōu)化目標函數(shù)為:

    19、

    20、

    21、其中,ym(k+i)為系統(tǒng)輸出;yr(k+i)為期望輸出;ufan(k+i|k)為風扇控制輸入;upump(k+i|k)為水泵控制輸入;uvalve(k+i|k)為閥門控制輸入;o為預(yù)測時域的長度;n為控制優(yōu)化的時域長度。

    22、優(yōu)選地,所述控制輸入的上下限約束的表達式為:

    23、umin≤u(k+1|k)≤umax;

    24、所述控制增量的約束的表達式為:

    25、△umin≤△u(k+1|k)≤△umax;

    26、所述系統(tǒng)輸出的約束的表達式為:

    27、ymin≤k(k+1|k)≤ymax;

    28、其中,umin為輸出下限;u(k+1|k)為控制輸出;umax為輸出上限;△umin為輸出增量的下限;△u(k+1|k)為所述控制輸出的增量;△umax為輸出增量的上限;ymin為約束下限;k(k+1|k)為系統(tǒng)輸出約束;ymax為約束上限。

    29、優(yōu)選地,所述控制律為:

    30、

    31、其中,uk+1表示下一時刻的控制輸入;uk表示當前時刻的控制輸入;ai和bi分別為第一約束條件參數(shù)和第二約束條件參數(shù);pi是ai在擾動方向p上的有效分量;f為調(diào)節(jié)參數(shù)。

    32、本專利技術(shù)公開了以下技術(shù)效果:

    33、本專利技術(shù)提供了一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,通過融合智能體的策略優(yōu)化和傳統(tǒng)模型預(yù)測控制中的動作優(yōu)化,解決了傳統(tǒng)方法僅采用模型預(yù)測控制導(dǎo)致對系統(tǒng)模型的依賴較大的缺陷,實現(xiàn)了對風扇、水泵和閥門等設(shè)備的控制策略實時優(yōu)化;通過設(shè)置智能體和反饋校正模塊,解決了傳統(tǒng)模型預(yù)測控制適用性較差的問題,實現(xiàn)了根據(jù)系統(tǒng)的實際狀態(tài)調(diào)整預(yù)測模型參數(shù);通過滾動優(yōu)化輸出的控制律結(jié)合多次實時反饋和預(yù)測修正,解決了傳統(tǒng)模型預(yù)測控制難以適應(yīng)突發(fā)的工況變化的缺陷,實現(xiàn)了系統(tǒng)在動態(tài)變化中保持高效的溫度控制。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述獎勵函數(shù)為:

    3.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述權(quán)重系數(shù)操作決策為:

    4.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述優(yōu)化目標函數(shù)為:

    5.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述控制輸入的上下限約束的表達式為:

    6.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述控制律為:

    【技術(shù)特征摘要】

    1.一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述獎勵函數(shù)為:

    3.根據(jù)權(quán)利要求1所述的一種基于強化學(xué)習(xí)模型預(yù)測控制的多熱源熱管理系統(tǒng)自適應(yīng)控制方法,其特征在于,所述權(quán)重系數(shù)操作決策為:

    4.根據(jù)權(quán)利要求...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:鄭瀟嚴宇超趙俊良孫曉霞劉震濤沈麗麗
    申請(專利權(quán))人:浙江大學(xué)
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码爆乳护士让我爽| 日韩精品无码一区二区三区四区 | 无码无套少妇毛多18PXXXX| 精品无码AV无码免费专区| 一本天堂ⅴ无码亚洲道久久 | 少妇人妻偷人精品无码视频新浪| 久久久久亚洲AV无码专区体验| 亚洲AV无码男人的天堂| 国产精品视频一区二区三区无码| 亚洲精品无码中文久久字幕| 国产精品无码无需播放器| 日产无码1区2区在线观看| 亚洲日韩精品无码专区加勒比☆| 国产午夜片无码区在线播放| 国产午夜鲁丝片AV无码免费| 亚洲综合一区无码精品| 亚洲AⅤ永久无码精品AA| 久久无码人妻一区二区三区午夜| 无码人妻丰满熟妇啪啪| 精品亚洲A∨无码一区二区三区| 久久精品无码一区二区日韩AV| 亚洲AV无码乱码麻豆精品国产| 久久亚洲AV永久无码精品| 精品无码成人久久久久久| 久久久久亚洲av无码专区喷水| 亚洲av无码国产精品夜色午夜| 国产免费av片在线无码免费看| 少妇无码AV无码专区线| 中文字幕AV无码一区二区三区| 久久无码无码久久综合综合| 亚洲国产a∨无码中文777| 亚洲日韩av无码| 一本加勒比HEZYO无码资源网| 狠狠躁天天躁无码中文字幕图 | 国产∨亚洲V天堂无码久久久| 日韩人妻无码一区二区三区久久99| 久久精品?ⅴ无码中文字幕| 亚洲精品97久久中文字幕无码 | 精品无码国产自产拍在线观看蜜 | 无码国内精品人妻少妇| 无码人妻精品一区二区三区夜夜嗨|