System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及光伏發電,具體為一種基于擴散模型的小樣本光伏數據生成方法。
技術介紹
1、數據的質量與數量是影響數據驅動模型性能的關鍵因素,當數據樣本不足時將導致模型的準確性下降。數據獲取不僅會受到高成本的收集與數據采集周期長的限制,隨著對數據安全與隱私保護意識的增強,相關的法律法規的出臺進一步加劇了數據獲取的難度。如何進行小樣本的數據增強具有重要研究價值和意義。
2、近年來,數據增強在圖像領域應用較多,在以時間序列數據為主的數據增強模型生成的數據與真實數據的分布存在顯著差異,限制了其在數據保護和提升數據驅動模型性能方面的應用。研究表明,相比于其他數據增強模型,擴散模型在處理小樣本數據時展現出了其獨特的優勢。擴散模型通過模擬數據生成的隨機過程,能夠在保持數據原始分布特性的同時,生成新的數據樣本。但是擴散模型目前在圖像生成領域的應用較為廣泛,目前鮮有基于擴散模型的光伏發電領域時間序列數據增強的方法。因而如何有效地應用擴散模型進行光伏發電領域時間序列數據增強是一個值得深入研究和探索的領域。
技術實現思路
1、鑒于上述存在的問題,提出了本專利技術。
2、因此,本專利技術解決的技術問題是:將擴散模型運用到時間序列數據增強中,生成物理上可信的數據樣本,提高數據驅動模型的性能。
3、為解決上述技術問題,本專利技術提供如下技術方案:一種基于擴散模型的小樣本光伏數據生成方法,包括:
4、讀取光伏數據集,計算數據的統計特性,并對數據進行標準化處理;
>5、設定擴散過程的關鍵參數,構建擴散模型;
6、利用深度學習模型整合全連接層與基于正弦和余弦函數的位置編碼,構建逆向去噪模型;
7、采用最小化均方誤差損失函數的方法,對逆向去噪模型進行訓練;
8、采用多元正態分布生成模擬數據,以原始數據均值作為均值參數,單位矩陣為協方差結構,構建各維度獨立同分布的噪聲數據集;
9、利用訓練好的去噪模型,對擴散過程中的噪聲數據執行逆向去噪,輸出具有原始數據趨勢的時間序列光伏數據;
10、使用樣本數據和與輸出數據和的比值,同倍比放大輸出的數據,得到最終生成數據。
11、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:所述構建擴散模型包括定義馬爾可夫鏈,通過在t個總擴散時間步驟中加入隨機噪聲,將原始光伏數據x0轉為高斯噪聲,進行前向擴散過程,表示為,
12、
13、其中,q(x1,x2,…,xtx0)為前向擴散過程的聯合分布,x1,x2,…,xt為擴散過程中的時間序列數據點,x0為原始數據點,t為擴散過程的總時間步數,q(xt|xt-1)是前向擴散過程的條件分布,xt是在時間步t的數據點,xt-1是在時間步t-1的數據點,βt是在時間步t的擴散方差,βt∈[0,1),i為單位矩陣。
14、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:在前向擴散過程中,在任意時間步t對xt進行采樣,表示為,
15、
16、其中,q(xt|x0)為前向擴散過程中xt的條件分布,αt是在時間步t的方差比例,是從時間步1到t的α值的累積乘積,zt表示噪聲,xt表示擴散后有噪聲數據的數據。
17、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:所述整合全連接層與基于正弦和余弦函數的位置編碼包括生成位置編碼矩陣position,提供序列中每個時間點的位置信息,表示為,
18、
19、其中,i是位置索引,表示序列中的時間點,j是維度索引,dpos表示位置編碼的維度數量,即編碼矩陣的寬度,10000是一個縮放因子,用于控制正弦和余弦函數的周期。
20、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:所述構建逆向去噪模型表示為,
21、
22、其中,μθ(xt,t)是由神經網絡參數θ預測的均值,表示在給定xt和時間步t下,逆向分布的期望值,是逆向去噪過程中預測的方差比例,由模型學習得到。
23、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:所述構建各維度獨立同分布的噪聲數據集表示為,
24、x~n(μ,i)
25、其中,x是生成的加噪數據向量,μ是原始數據的均值向量。
26、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:所述得到最終生成數據包括計算原始樣本數據的總和sx,表示為,
27、
28、其中,xi是原始樣本數據中的第i個數據點,n是樣本數量;
29、計算逆向去噪過程生成的輸出數據的總和sy,表示為,
30、
31、其中,yi是輸出數據中的第i個數據點。
32、作為本專利技術所述的基于擴散模型的小樣本光伏數據生成方法的一種優選方案,其中:通過比較基準值和目標值,計算生成放大因子k,表示為,
33、
34、利用生成放大因子k,對輸出數據中的每個數據點進行調整,表示為,
35、yi最終=k·yi
36、其中,yi最終是調整后的輸出數據點。
37、一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現如上所述基于擴散模型的小樣本光伏數據生成方法的步驟。
38、一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如上所述基于擴散模型的小樣本光伏數據生成方法的步驟。
39、本專利技術的有益效果:本專利技術提供的基于擴散模型的小樣本光伏數據生成方法基于擴散模型成功生成了在數值和結構上與真實光照強度相似的時間序列數據。通過統計分析,驗證了生成樣本與真實數據的相似性,展示了本專利技術在光伏發電領域的小樣本時間序列數據生成方面的創新性和實用性。
40、在較小的訓練次數下即可達到與真實數據分布高度一致的結果,較低的mmd值也表明了模型在特征空間中對真實數據分布的逼近效率。
本文檔來自技高網...【技術保護點】
1.一種基于擴散模型的小樣本光伏數據生成方法,其特征在于,包括:
2.如權利要求1所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述構建擴散模型包括定義馬爾可夫鏈,通過在T個總擴散時間步驟中加入隨機噪聲,將原始光伏數據x0轉為高斯噪聲,進行前向擴散過程,表示為,
3.如權利要求2所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:在前向擴散過程中,在任意時間步t對xt進行采樣,表示為,
4.如權利要求3所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述整合全連接層與基于正弦和余弦函數的位置編碼包括生成位置編碼矩陣position,提供序列中每個時間點的位置信息,表示為,
5.如權利要求4所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述構建逆向去噪模型表示為,
6.如權利要求5所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述構建各維度獨立同分布的噪聲數據集表示為,
7.如權利要求6所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述得到最終生成數據包括計算
8.如權利要求7所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:通過比較基準值和目標值,計算生成放大因子k,表示為,
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至8中任一項所述的基于擴散模型的小樣本光伏數據生成方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至8中任一項所述的基于擴散模型的小樣本光伏數據生成方法的步驟。
...【技術特征摘要】
1.一種基于擴散模型的小樣本光伏數據生成方法,其特征在于,包括:
2.如權利要求1所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述構建擴散模型包括定義馬爾可夫鏈,通過在t個總擴散時間步驟中加入隨機噪聲,將原始光伏數據x0轉為高斯噪聲,進行前向擴散過程,表示為,
3.如權利要求2所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:在前向擴散過程中,在任意時間步t對xt進行采樣,表示為,
4.如權利要求3所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述整合全連接層與基于正弦和余弦函數的位置編碼包括生成位置編碼矩陣position,提供序列中每個時間點的位置信息,表示為,
5.如權利要求4所述的基于擴散模型的小樣本光伏數據生成方法,其特征在于:所述構建逆向去噪模型表示為,
6.如權利...
【專利技術屬性】
技術研發人員:趙國漢,李衛兵,余意,鄧友漢,華小軍,劉通,莫莉,溫棟,鄒林峰,徐翠梅,汪磊,陳靜,效文靜,王開舒,
申請(專利權)人:三峽金沙江云川水電開發有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。