System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及空氣質量監測,具體涉及一種基于集成深度學習的空氣質量預報方法。
技術介紹
1、大氣污染主要是由工業生產、農業活動、日常生活、交通運輸以及城市化進程等多種人為活動共同造成的,同時氣象條件也是影響大氣污染的重要自然因素。大氣污染不僅局限于某一地區,還可能跨越區域乃至全球。傳統的數值模式比如常用的中尺度氣象預報模式wrf,其特點有高分辨率、靈活性、強大的物理過程描述、豐富的數據輸入等特點,可應用到天氣預報、氣候模擬、災害預警、農業氣候服務等。還有一種專門用于空氣質量預報和評估的模型cmaq,其最大特色即在一個大氣(one-atmosphere)的觀念,突破了傳統模式針對單一物種和單相物種的模擬,將復雜的空氣污染狀況如對流層的臭氧、pm、毒化物、酸沉降及能見度等問題綜合處理,用于多尺度、多污染的空氣質量預報、評估和決策研究等多種用途,是研究大氣污染物時空分布和成分貢獻的重要手段。
2、這兩種模型能夠幫助研究人員了解大氣污染的來源、成因、污染程度、持續時間、主要成分及各因素的相對貢獻等關鍵信息。然而,這些傳統數值模式的運行時間較長,并且對計算資源的需求極高。例如,在本地部署一套wrf氣候場預報模式和cmaq污染場預報模式,通常需要一臺配置為64核處理器、128gb內存的計算機全天候運行。此外,這些模型每天產生的數據量約為20gb,存在這嚴重的存儲成本、運維成本、計算成本。
技術實現思路
1、本專利技術的目的在于提供一種基于集成深度學習的空氣質量預報方法,為了減少計算
2、為實現上述目的,本申請采用以下方案:
3、本專利技術提供一種基于集成深度學習的空氣質量預報方法,具體包括以下步驟:
4、s1、獲取監測區域內各網格對應的樣本數據集,所述樣本數據集包括基于wrf模擬的模型訓練特征以及基于cmaq模擬的模型訓練標簽;
5、s2、基于皮爾森相關系數,分析各網格之間數據的相關性,得到模型訓練標簽的標簽相關性系數以及模型訓練特征的特征相關性系數;
6、s3、構建神經網絡圖結構,將各網格作為神經網絡圖的各節點,根據各網格之間的特征相關性系數以及標簽相關性系數判斷節點之間的連接關系,根據節點之間的連接關系構建神經網絡圖結構的連接矩陣列表;
7、s4、構建集成預報模型,集成預報模型包括圖神經網絡層和mlp全連接層,將神經網絡圖結構以及連接矩陣列表作為圖神經網絡層的輸入,將圖神經網絡層的輸出作為mlp全連接層的輸入,經過mlp全連接層的非線性組合后,得到監測區域內的空氣質量預測結果。
8、在一些具體實施方案中,步驟s1的具體過程包括:
9、s11、獲取wrf模擬的wrf數據集以及cmaq模式的cmaq數據集,其中,wrf數據集包括以下字段:地表處的向上波輻射通量glw、?地形高度hgt、?邊界層高度pblh、地面氣壓psfc、地面2米濕度q2、降水量rainnc、?地面2米溫度t2、?地表溫度tsk、?地面10米風場緯度分量u10、?地面10米風場經度分量v10、網格id、發布時間;
10、cmaq數據集包括以下字段:pm25_tot、pm10、o3、co、no2、so2、網格id、發布時間;
11、s12、對wrf數據集和cmaq數據集中的數據分別進行數據格式轉換,得到數據集以及;
12、將glw、hgt、pblh、psfc、q2、rainnc、t2、tsk、u10、v10的字段值轉換為浮點數,網格id的字段值轉換為正整數,發布時間的字段值轉換為時間類型;
13、將pm25_tot、pm10、o3、co、no2、so2的字段值轉換為浮點數,網格id的字段值轉換為正整數,發布時間的字段值轉換為時間類型;
14、s13、將數據集和中的數據按照網格id字段進行合并,得到樣本數據集data;
15、s14、根據樣本數據集data中的發布時間字段的字段值,挖掘時間序列特征,時間序列特征包括年份、月份、周、是否為節假日、天、小時;
16、s15、將glw、hgt、pblh、psfc、q2、rainnc、t2、tsk、u10、v10、時間序列特征作為模型訓練特征,將pm25_tot、pm10、o3、co、no2、so2作為模型訓練標簽。
17、在一些具體實施方案中,步驟s1中得到樣本數據集data后包括對樣本數據集data中pm25_tot、pm10、o3、co、no2、so2字段中的缺失值進行填補,填補的方法分別為:
18、采樣線性回歸填補pm25_tot、pm10、o3字段的缺失值,計算公式為:
19、
20、其中,pm25null表示pm25_tot字段的缺失值,pm10null表示pm10字段的缺失值,o3null表示o3字段的缺失值,pm10、pm25、hour、weekday表示pm25_tot、pm10、小時和周字段的字段值,?w1、w2、w3表示對應的權重,solar_radiation表示太陽輻射特征,temp表示溫度特征;co、no2、so2均采用歷史平均值填充缺失值。
21、在一些具體實施方案中,步驟s3判斷節點之間的連接關系的具體過程為:
22、根據網格之間的標簽相關性系數以及特征相關性系數計算節點之間的聚合相關系數;
23、當聚合相關性系數大于0.7時,判斷節點之間存在雙向連接線;
24、當聚合相關系數小于0.7且標簽相關性系數大于0.5時,判斷節點之間存在單向連接線。
25、在一些具體實施方案中,步驟s3中構建連接矩陣的方法為:
26、對每個節點進行編號,并且對于每個節點,根據其他節點與當前節點連接的連接關系,得到一組與當前節點相關的相關連接矩陣;
27、統計所有節點的相關連接矩陣,得到神經網絡圖結構的連接矩陣列表。
28、在一些具體實施方案中,輸入圖神經網絡層的數據格式為三維數據,三維分別為節點數量、每個節點對應的樣本數量以及每個樣本對應的模型訓練特征數量,其中,從樣本數據集data中獲取的每個節點對應的固定數量的數據作為樣本數據,每個樣本數據包含了16個特征,分別為:glw、hgt、pblh、psfc、q2、rainnc、t2、tsk、u10、v10、年份、月份、周、是否為節假日、天、小時。
29、在一些具體實施方案中,圖神經網絡層包括兩層sageconv特征提取層,兩層sageconv特征提取層對三維數據中每個樣本對應的特征進行兩次擴展,每層sageconv特征提取層的輸出的計算公式為:
30、;
31、其中,l表示當前特征提取層輸入的模型訓練特征數量,表示第h個節點的第r個模型訓練特征值,表示第h個節點的第r個模型訓練特征值對應的本文檔來自技高網...
【技術保護點】
1.一種基于集成深度學習的空氣質量預報方法,其特征在于,具體包括以下步驟:
2.根據權利要求1所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟S1的具體過程包括:
3.根據權利要求2所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟S1中得到樣本數據集DATA后包括對樣本數據集DATA中PM25_TOT、PM10、O3、CO、NO2、SO2字段中的缺失值進行填補,填補的方法分別為:
4.根據權利要求2所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟S3判斷節點之間的連接關系的具體過程為:
5.根據權利要求4所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟S3中構建連接矩陣的方法為:
6.根據權利要求2所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,輸入圖神經網絡層的數據格式為三維數據,三維分別為節點數量、每個節點對應的樣本數量以及每個樣本對應的模型訓練特征數量,其中,從樣本數據集DATA中獲取的每個節點對應的固定數量的數據作為樣本數據,每個樣本數據包含了16
7.根據權利要求6所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,圖神經網絡層包括兩層SAGEConv特征提取層,兩層SAGEConv特征提取層對三維數據中每個樣本對應的模型訓練特征進行兩次擴展,每層SAGEConv特征提取層的輸出的計算公式為:
8.根據權利要求6所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,MLP全連接層包括四層線性連接層,四層線性連接層用于對三維數據中的特征進行擴展或壓縮,其中,每一層線性連接層的輸出的計算公式為:
9.根據權利要求8所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,MLP全連接層還包括一層跳躍連接層,四層線性連接層包括第一全連接層、第二全連接層、第三全連接層和第四全連接層,跳躍連接層用于連接第一全連接層和第三全連接層,第一全連接層的輸出作為第二全連接層的輸入,第二全連接層的輸出作為第三全連接層的輸入,跳躍連接層的輸入為第一全連接層的輸出和第三全連接層的輸出,跳躍連接層的輸出作為第四全連接層的輸入,第一全連接層和第三全連接層輸出的模型訓練特征數量相同。
10.根據權利要求9所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,跳躍連接層的輸出為:
...【技術特征摘要】
1.一種基于集成深度學習的空氣質量預報方法,其特征在于,具體包括以下步驟:
2.根據權利要求1所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟s1的具體過程包括:
3.根據權利要求2所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟s1中得到樣本數據集data后包括對樣本數據集data中pm25_tot、pm10、o3、co、no2、so2字段中的缺失值進行填補,填補的方法分別為:
4.根據權利要求2所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟s3判斷節點之間的連接關系的具體過程為:
5.根據權利要求4所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,步驟s3中構建連接矩陣的方法為:
6.根據權利要求2所述的一種基于集成深度學習的空氣質量預報方法,其特征在于,輸入圖神經網絡層的數據格式為三維數據,三維分別為節點數量、每個節點對應的樣本數量以及每個樣本對應的模型訓練特征數量,其中,從樣本數據集data中獲取的每個節點對應的固定數量的數據作為樣本數據,每個樣本數據包含了16個模型訓練特征,分別為:glw、hgt、pblh、psfc、q2、rainnc、t2、tsk、u10、v10、年份、月份...
【專利技術屬性】
技術研發人員:張宜峰,牟華僑,孫歡歡,薛云博,付為程,謝佳麗,
申請(專利權)人:四川國藍中天環境科技集團有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。