System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及電力系統,特別是一種電碳耦合市場用戶側自主決策方法。
技術介紹
1、過度的碳排放(carbon?emission,ce)對全球氣候構成了嚴重的威脅,例如惡劣天氣事件,海平面上升,生態系統和生物多樣性的破壞等,中國近48.2%的碳排放來自化石燃料發電。為了解決這些問題,脫碳被電力部門列為關鍵優先事項,目前已制定了一些基于環境的政策旨在減少ce,例如碳上限、限額與交易、碳稅等。隨著分布式能源(distributedenergy?resources,ders)在配電網中的滲透率大幅提高,碳交易被視為促進當地脫碳和可再生能源在配電層面適應的重要途徑。如何在分銷層面充分激勵用戶側參與耦合的電碳交易以及如何實現分布式能源交易信息隱私和差異化目標是亟待關注的問題。現有技術基于智能合約的交易平臺來實現產消者和微電網之間的能源和碳配額交換,但忽略了配電網絡的限制。現有技術提出了一種基于跨鏈交易技術的分布式光伏之間電碳交易的運行機制,現有技術提出了一種區塊鏈應用程序,用于在聯網的微電網之間進行能源和碳許可證的交易,然而這種基于發電量的解決方案可能會對用戶施加更高的ce成本,從而進一步導致激勵不均衡,削弱社會福利。使用方作為供給方產生消費電子產品的根本驅動力,也應該承擔內部經濟責任。為此,現有技術提出了雙邊碳交易的概念,以將ce成本分配給用戶側和供應側。
2、盡管用戶側的ce義務得到了普遍認可,但由于對從電力部門的供應側分配的ce的短視考慮,它對于實際實施仍然處于初步階段。且到目前為止,碳電市場領域方面的研究很少,碳電交易僅
3、此外,在上述三種機制中,電碳市場嚴重依賴于精確的參數,可靠的不確定性估計和完整的經濟模型,這些在現實中通常是不切實際的。為了解決這個問題,強化學習(reinforcement?learning,rl)作為下一代決策方法,可以在捕獲系統不確定性和適應各種狀態動態方面發揮巨大優勢。然而這種集中式學習算法的缺點在于由于強制獲取所有代理的局部觀察和動作而引起的可擴展性和隱私問題。為了科普這一問題,聯邦學習(federated?learning,fl)技術開始被集成到強化學習中,形成聯邦強化學習(federatedreinforcement?learning,frl)算法。具體來說,frl的自然分布特性可以無需共享信息充分實現局部模型訓練。到目前為止,frl在電力交易中的應用越來越受到關注,如綜合能源系統、建筑社區、微電網等。需要指出的是,從現有技術中可以看出,frl在電力交易中的研究仍然缺乏對用戶側具有差異化目標的異構der的充分考慮,這限制了frl在異構市場環境下使der做出適應性決策的優勢。
技術實現思路
1、本專利技術的目的在于克服現有技術的缺點,提供一種電碳耦合市場用戶側自主決策方法。本專利技術的目的通過以下技術方案來實現:一種電碳耦合市場用戶側自主決策方法,該方法包括:
2、構建電碳市場交易模型,該模型通過碳電協調者協調碳電傳感器,將碳電數據分布到不同的der上,der從電碳市場協調器獲得共享模型并進行本地訓練,然后合并本地培訓模型生成全局模型;所述der包括地鐵模型、聚合電動汽車模型、pv光伏模型、碳排放單元模型和負荷聚合商模型;
3、建立離散時間步長的部分可觀察馬爾可夫決策過程對der的電碳市場出價/要價作為一個順序決策過程進行管理;
4、基于馬爾可夫決策過程,每個der在聯邦強化學習模型中執行本地培訓,每個der通過本地自訓練得出自己的電碳市場交易決策。
5、具體的,所述地鐵模型為:
6、k=uk,u∈{1,2,...,u}(1a)
7、
8、0≤isoei≤100%(1d)
9、
10、其中,公式(1a)表示運行的地鐵車站總數;公式(1b)表示從首站到終點站的總運行時間;公式(1c)限制每個站間的運行時間;公式(1d)限制每個站間旅程的oesd的運營isoe;公式(1e)-(1g)是協調運行時間和電碳市場交易周期;tmetro為單位電碳市場交易周期;和為第t個電調交易周期內首末站間區間的運行時間;為第t個電務交易周期內覆蓋整個區間的運行時間,按第區間的運行時間之和計算;第t個交易周期的第一個站間區間也是第t-1個交易周期的最后一個站間區間第t個交易周期的最后一個站間區間是第t+1個交易周期的第一個站間區間兩個相鄰交易周期的和之和等于is/ie站間區段的運行時間;公式(1h)表示在第t個電碳市場交易時段期間的地鐵的凈電力消耗,由函數p(i,ti,isoei)計算:
11、
12、式中,a1,i,a2,i,a3,i,a4,i,和a5,i是預先校準的常系數。
13、所述聚合電動汽車模型為:
14、
15、其中,公式(2a)表示聚合ev的充電功率經受預校準間隔[lev,agg,μev,agg],通過該預校準間隔,聚合ev獲得期望的充電能量;超參數矩陣h和j用于描述順序充電空間:
16、
17、式中,hi是具有包含i?1s和(t-i)0s的所有排列行的矩陣;(1)i和(0)i分別表示值為0和1的長度為的列向量,此外,和為最小/最大充電功率和每輛電動汽車此外,和是由每輛單獨的電動汽車最小/最大充電功率和計算,計算如下:
18、
19、式中:μev,agg為聚合電動汽車充電功率上界;lev,agg為聚合電動汽車充電功率下界;為第n輛電動汽車充電功率上限;為第n輛電動汽車充電功率下限;
20、所述pv光伏模型為:
21、
22、式中:ptpv為t時刻光伏發電量;ptpv,min為t時刻光伏發電本文檔來自技高網...
【技術保護點】
1.一種電碳耦合市場用戶側自主決策方法,其特征在于:該方法包括:
2.根據權利要求2所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述地鐵模型為:
3.根據權利要求1所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述碳排放單元模型為:
4.根據權利要求1所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述電碳市場交易模型為:
5.根據權利要求1所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述離散時間步長的部分可觀察馬爾可夫決策過程通過<N,S,O,A,T,R,γ>,定義,N個代理,狀態集S,私有觀察集O,動作集A,回報函數集R,狀態轉移函數T和折扣因子γ;
6.根據權利要求5所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述交易效用建模為二次函數:
7.根據權利要求6所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述聯邦強化學習模型的訓練過程包括更新的局部模型的全局聚合和局部模型訓練使用的演員-評論家網絡;
8.根據權利要求6所述的一種電
9.根據權利要求6所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:采用元功能和時變控制變體來協調在WFTD?3中訓練的局部模型和電碳市場協調器的全局模型其包括元函數和時變控制變體;
...【技術特征摘要】
1.一種電碳耦合市場用戶側自主決策方法,其特征在于:該方法包括:
2.根據權利要求2所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述地鐵模型為:
3.根據權利要求1所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述碳排放單元模型為:
4.根據權利要求1所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述電碳市場交易模型為:
5.根據權利要求1所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述離散時間步長的部分可觀察馬爾可夫決策過程通過<n,s,o,a,t,r,γ>,定義,n個代理,狀態集s,私有觀察集o,動作集a,回報函數集r,狀態轉移函數t和折扣因子γ;
6.根據權利要求5所述的一種電碳耦合市場用戶側自主決策方法,其特征在于:所述交易效用建模為二次函數:
7.根據權利要求6所述的一種電碳耦合市場用戶側自主決策方法,其...
【專利技術屬性】
技術研發人員:魏昭彬,劉繼春,陳輝銘,唐志遠,黃振宇,曾繁仰,劉俊勇,
申請(專利權)人:四川大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。