System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及儲能、電力現貨市場,尤其涉及一種基于儲能系統參與日前交易市場的優化調度方法。
技術介紹
1、隨著能源需求的不斷增加和可再生能源(如太陽能、風能等)的快速發展,電能供應的不穩定性和間歇性問題日益突出,同時電能產生的波動也給電網的穩定運行帶來了挑戰。而儲能系統作為一種平衡能源供需、提高電能系統可靠性的重要手段,其可以通過與電網的互動實現電能的優化調度和智能分配,從而成為智能電網的重要組成部分之一。然而傳統的儲能智能調度模型一方面依賴于預設的規則或閾值,一方面受到大量的人工干預,因此其很難在實際運行環境中做出快速準確的決策,最終導致儲能系統出現效率低下和不可靠的問題。
2、傳統的儲能系統技術有如下特點、缺陷:
3、第一類規則控制算法。基于規則的控制算法往往依賴于預設的規則和閾值,這些規則和閾值通常是基于經驗或歷史數據設定的,缺乏靈活性和適應性。當電力系統運行狀態發生變化時,這些規則可能不再適用,導致儲能系統的調度效果下降。
4、第二類預測控制算法。預測控制算法依賴于對電力系統未來狀態的預測,但電力系統的運行狀態往往受到多種因素的影響,包括天氣、負荷變化、設備故障等,這些因素的變化難以準確預測。因此,預測控制算法在實際應用中可能面臨預測精度不足的問題,從而影響儲能系統的調度效果。
5、第三類最優控制算法。最優控制算法雖然能夠實現對儲能系統最優調度的目標,但通常需要建立復雜的數學模型,并對模型進行求解。然而,電力系統的運行狀態往往非常復雜,難以用簡單的數學模型進行描述。此外,最
技術實現思路
1、本專利技術旨在解決
技術介紹
中的問題。專利技術了一種基于儲能系統參與日前交易市場的優化調度方法。所述方法包括以下步驟:s1,搭建儲能系統參與日前交易市場的規則約束環境,所述規則約束環境包括:儲能狀態約束、充放電功率約束;
2、s2,建立改進的ddpg算法,包括以下步驟:
3、s2.1、設置初始化狀態s:設置ddpg算法的狀態為一維列表[t,et],其包含兩個元素:時間t,t時刻儲能系統能量狀態et;
4、s2.2、定義動作空間a:動作空間由儲能系統的充、放電功率的n個連續值組成,表達式為:a={a1,a2,...,an};
5、其取值范圍為[-pmax,pmax],-p、p分別表示充、放電的功率值,且根據日前市場的申報規則,將p值的精度設置為0.01;
6、s2.3、設定模型的參數st:所述參數st包括:儲能系統的額定容量、儲能系統的最大充電功率、儲能系統的起始soc、儲能系統的結束soc、儲能系統的充電效率、儲能系統的放電效率、儲能系統的最小soc、儲能系統的最大soc、輸配電價、政府基金及附加、日前價格、補償價格、補償系數;
7、s2.4、構造及改進網絡:
8、初始化當前actor、critic網絡,然后把當前actor網絡和critic網絡的網絡參數分別復制給目標actor和critic網絡;
9、改進actor、critic網絡:用transformer模型架構替換actor、critic架構;
10、在critic結構的基礎上增加一個輔助網絡用于估計q值的不確定性,計算多個critic的標準差值,用標準差值來反映q值的不確定性,具體計算公式為:
11、
12、使用的損失函數為:
13、loss(θi)=τl(θi)+(1-τ)lstd(θ)+βc(θi)
14、其中:
15、l(θi)為單個critic網絡的損失函數值,θi為critic網絡的參數值;
16、r(st,at)為處于狀態st采取動作at所獲得的獎勵值;
17、γ為探索率,其范圍為(0,1);為下一時刻的q′值,q(st,at|θi)為當前時刻的q值;
18、lstd(θ)為多個critic網絡損失函數的標準差;
19、為目標網絡q值的標準差;
20、qstd(s,a|θ)為當前網絡q值的標準差;
21、c(θi)=(qi(s,a|θi)-qstd(s,a|θ))2,τ,β∈(0,1);
22、s3,生成樣本:使用當前actor網絡與構造的日前交易市場的規則約束環境進行交互,即將儲能系統的狀態s輸入到當前actor網絡,得到動作a,此時環境會返回給下一時刻的狀態s′和獎勵r;
23、s4,更新當前critic網絡:包括一下步驟:從經驗池里面取出一個樣本(s,a,r,s′)進行訓練,將(s,a,r,s′)中的s和a輸入到當前critic網絡中,得到當前的q值q(s,a),將(s,a,r,s′)中的s′輸入到目標actor網絡中,得到動作a′,將s′和a′一起輸入到目標critic網絡中,得到q(s′,a′),計算目標q值為:
24、q′=r+γq(s′,a′)
25、將q′看成標簽,更新當前critic網絡使得輸出q值接近標簽q′值,即需要使用梯度下降法最小化更新當前critic網絡的所有參數θ,即更新當前critic網絡;
26、s5,更新當前actor網絡:包括一下步驟:利用actor網絡計算出狀態下s的動作anew,在當前critic網絡里給出q值q(s,anew),更新actor網絡使得q值輸出q(s,anew)最大,即最大化q(s,anew),具體的計算方式是,用符合函數的求導法則,求(q對動作a的梯度)*(動作a對參數ω的梯度):
27、
28、然后用梯度上升更新actor網絡的所有參數ω:
29、
30、其中,0≤α≤1
31、s6,對目標actor網絡和目標critic網絡進行軟更新:引入一個學習率τ,將舊的目標網絡參數和新的對應網絡參數做加權平均,然后賦值給目標網絡,
32、target?actor網絡更新過程:
33、ω′←τω+(1-τ)ω′
34、target?critic網絡更新過程:
35、θ′←τθ+(1-τ)θ′
36、學習率τ∈(0,1),一般取的比較小,比如0.1或0.01,甚至0.005。
37、s7,使用當前actor網絡根據步驟s2采樣。
38、進一步地,所述步驟s1中儲能狀態約束的計算方式為:日前申報電量的計算公式為:其中表示儲能系統在t時刻的日前電量,分別表示儲能系統在日前市場中t-1時刻充進、放出的電量,日前申報電量需要滿足儲能系統最大、最小能量值的約束,即的計算公式為:其中δt為時間,ηin為充電效率,為日前市場中的充電功率,的計算公式為:其中δt為時間,ηout為充電效率,為日前市場中的放電功率。
39、進一步地,所述步驟s1中充本文檔來自技高網...
【技術保護點】
1.一種基于儲能系統參與日前交易市場的優化調度方法,其特征在于,所述方法包括以下步驟:
2.根據權利要求1所述的一種基于儲能系統參與日前交易市場的優化調度方法,其特征在于,所述步驟S1中儲能狀態約束的計算方式為:日前申報電量的計算公式為:其中表示儲能系統在t時刻的日前電量,分別表示儲能系統在日前市場中t-1時刻充進、放出的電量,日前申報電量需要滿足儲能系統最大、最小能量值的約束,即的計算公式為:其中Δt為時間,ηin為充電效率,為日前市場中的充電功率,的計算公式為:其中Δt為時間,ηout為充電效率,為日前市場中的放電功率。
3.根據權利要求1所述的一種基于儲能系統參與日前交易市場的優化調度方法,其特征在于,所述步驟S1中充放電功率約束的計算方式為:
4.根據權利要求1所述的一種基于儲能系統參與日前交易市場的優化調度方法,其特征在于,所述步驟S2.3中的日前價格、補償價格、補償系數為每日24時刻點的數據。
【技術特征摘要】
1.一種基于儲能系統參與日前交易市場的優化調度方法,其特征在于,所述方法包括以下步驟:
2.根據權利要求1所述的一種基于儲能系統參與日前交易市場的優化調度方法,其特征在于,所述步驟s1中儲能狀態約束的計算方式為:日前申報電量的計算公式為:其中表示儲能系統在t時刻的日前電量,分別表示儲能系統在日前市場中t-1時刻充進、放出的電量,日前申報電量需要滿足儲能系統最大、最小能量值的約束,即的計算公式為:其中δt為時間,...
【專利技術屬性】
技術研發人員:沈山山,陳佳俊,燕兆,商敬男,郭鵬飛,
申請(專利權)人:北京飔合科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。