System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及鋰離子電池,尤其涉及一種鋰電池安全優化快速充電控制方法。
技術介紹
1、“可充電”的鋰離子電池為日常生活帶來了便利,而支持電池可充電的關鍵是充電技術,為了緩解電動汽車用戶的里程焦慮和提高其滿意度,鋰離子電池充電速度的提升也成了人們視野中的熱門話題。過大速率的快速充電可以顯著減少充電時間,但違反了安全限制,可能會導致電池過熱,縮短電池壽命,甚至引起安全問題,因此,鋰離子電池充電是一項具有挑戰性的任務,高效的充電策略對鋰電池的運行優化和壽命延長起著至關重要的作用。
2、傳統充電策略包括工業上被廣泛應用的恒流恒壓(cc-cv)充電協議和其改進版本,這類充電方法由于沒有對電池狀態和安全參數反饋的考慮,充電效果并不理想?,F有技術提出基于模型的反饋充電策略,電池模型主要被劃分為電化學模型和等效電路模型,在此基礎上通過設計充電優化算法,來解決在最小化充電時間的同時保證不違反充電安全約束的多目標優化問題。針對傳統優化算法存在的計算復雜度高、模型依賴程度大、在線可跟蹤性弱等問題,引入深度強化學習算法。
3、專利公開號為cn112018465a的中國專利基于ddpg算法,對用于決策電池充電電流的神經網絡進行訓練,使電池滿足充電物理約束的同時,完成充電任務。但該方法依靠專家經驗設計獎勵模式,無法保證其對應的充電策略是最優的,且充電物理約束被設置為軟約束,充電過程存在安全隱患,因此,我們提出一種鋰電池安全優化快速充電控制方法,用于解決上述提到的問題。
技術實現思路
1
2、為達到以上目的,本專利技術采用的技術方案為:一種鋰電池安全優化快速充電控制方法,包括以下步驟:
3、s1.構建鋰離子電池電熱老化耦合模型,確定模型控制方程,并根據模型建立強化學習所需的離線充電環境;
4、s2.初始化一個策略網絡和兩個價值網絡,定義強化學習狀態空間和動作空間,并設置充電獎勵函數和成本函數;
5、s3.依據s1步驟中的電池模型更新狀態空間變量,并將當前狀態、充電動作、獎勵值、成本值、下一時刻狀態添加至經驗池,基于分布式軟演員評論家算法和保守策略優化技巧迭代訓練構建的充電策略網絡、價值評估網絡和成本評估網絡直到收斂,得到收斂后的策略網絡模型;
6、s4.實時采集電池當前的端電壓、表面溫度、環境溫度數據,利用狀態觀測器估計不可測的電池電量狀態和核心溫度,將經過處理的狀態信息輸入步驟s3中訓練完畢的充電策略網絡,決策出最優充電電流軌跡。
7、優選的,所述s1步驟中鋰離子電池電熱老化耦合模型包括用于捕獲電池在不同溫度下的行為的等效電路模型,用于表征電池的內部和表面溫度的熱力學模型和用于監測電池健康狀態的老化模型。
8、優選的,所述s1步驟中鋰離子電池電熱老化耦合模型的控制方程推導過程如下:
9、電池的物理行為是由一個與溫度相關的二階rc等效電路模型來描述的,根據基爾霍夫定律,可推導出控制方程為:
10、
11、vt(t)=vocv(soc)-v1(t)-v2(t)-r0(t,t)i(t)
12、式中,soc、i、cn、vt分別表示電池的荷電狀態、充電電流、標稱容量和端電壓;開路電壓vocv是soc的多項式函數;v1、v2分別為兩個電阻-電容對的電壓;歐姆內阻r0、極化電阻r1、r2以及極化電容c1、c2被表示為soc和溫度的函數;在縱向均勻性假設下,采用雙態熱模型來捕捉圓柱形電池的集總熱特性,傳熱過程的控制方程為:
13、
14、式中,ts、tc和tf分別為電池表面溫度、核心溫度和環境溫度;rs和rc分別為熱對流電阻和熱傳導電阻;cs和cc分別為電池表面和堆芯的熱容;產熱率q由貝納爾迪熱生成模型給出:
15、q(t)=(vocv(soc)-vt(t))i(t)+i(t)tm(t)en(soc,t)
16、
17、式中,en為電化學反應中的熵變;tm為電池的平均溫度;此外采用阿倫尼烏斯方程的半經驗模型評估電池容量衰減率,利用電荷吞吐量可以量化不同充電倍率下的容量衰減:
18、
19、式中,ah為總放電安時吞吐量;rg、z、b、ea、c分別為通用氣體常數、冪律因子、指前因子、活化能和充電倍率;δsoh為健康狀態衰退率;δt為采樣間隔。
20、優選的,所述步驟s2實現過程如下:
21、狀態空間和動作空間定義為:
22、st={soc(t),vt(t),tc(t)}
23、at={i(t)|i(t)∈[0,imax]}
24、式中,imax為約束的最大充電電流;充電策略可以通過一個多目標優化問題來制定,在保證充電約束滿足的同時最小化達到期望soc所需的充電時間;獎勵函數設置為只和充電速度有關:
25、rt=|soctar-soc(t)|
26、式中,soctar為期望soc,表示充電過程完成;充電約束被分別設計為成本函數:
27、
28、csoh(t)=|δsoht|
29、式中,cvolt和ctemp用于懲罰電池的過壓和過溫,而csoh表示電池的老化情況;每一步的總成本函數被描述為:
30、ct=cvolt(t)+ctemp(t)+csoh(t)。
31、優選的,所述s3步驟中成本評估網絡實現過程如下:
32、改寫原約束優化問題,該問題的拉格朗日對偶形式為:
33、
34、式中,λ為拉格朗日乘子;和分別為獎勵和成本函數的估計;d為約束閾值;ρπ(s)表示由策略π引起的狀態分布;充電過程中的成本函數低估被用于其他狀態-動作對的訓練,并在時間差分學習中積累成較大的偏差,造成違反約束的充電行為;采用保守策略優化技巧構建成本評估網絡以解決低估問題,使用真實成本值的上置信界限來代替估計,即計算集合的“均值+加權標準差”,表示為:
35、
36、式中,e表示使用e個相同網絡結構且訓練過程獨立的自舉網絡進行成本值估計;k為保守性參數;成本評估網絡參數統稱為ψ,各成本子網絡參數采用時間差分誤差方式更新。
37、優選的,所述s3步驟中充電策略網絡和價值評估網絡實現過程如下:
38、傳統強化學習方法在充電訓練中的獎勵值函數的過估計會造成充電速度的下降,而值分布學習方法能顯著改善獎勵值函數的高估問題,從而減少學習過程中策略性能不穩定的現象;
39、訓練階段基于演員-評論家本文檔來自技高網...
【技術保護點】
1.一種鋰電池安全優化快速充電控制方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述S1步驟中鋰離子電池電熱老化耦合模型包括用于捕獲電池在不同溫度下的行為的等效電路模型,用于表征電池的內部和表面溫度的熱力學模型和用于監測電池健康狀態的老化模型。
3.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述S1步驟中鋰離子電池電熱老化耦合模型的控制方程推導過程如下:
4.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述步驟S2實現過程如下:
5.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述S3步驟中成本評估網絡實現過程如下:
6.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述S3步驟中充電策略網絡和價值評估網絡實現過程如下:
7.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述S4步驟中充電策略部署過程如下:
【技術特征摘要】
1.一種鋰電池安全優化快速充電控制方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述s1步驟中鋰離子電池電熱老化耦合模型包括用于捕獲電池在不同溫度下的行為的等效電路模型,用于表征電池的內部和表面溫度的熱力學模型和用于監測電池健康狀態的老化模型。
3.根據權利要求1所述的一種鋰電池安全優化快速充電控制方法,其特征在于:所述s1步驟中鋰離子電池電熱老化耦合模型的控制方程推導過程如下:
4....
【專利技術屬性】
技術研發人員:陳立平,陶雨鑫,張丹妮,倪麗萍,周盛瑩,李鵬華,侯杰,
申請(專利權)人:合肥工業大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。