一種人口數據空間化動態建模方法,基于各種人口分布影響因素數據,利用遺傳規劃算法GP與改進遺傳算法GA相嵌套的方法進行統一快速人口數據空間化建模及優化,具體實現為:首先歸一化處理影響因素數據;后將影響因素歸一化值作為GP輸入,組成搜索空間,來快速求解具有最佳適應度的模型結構;在GP每代個體選擇復制操作過程中利用改進GA對待復制個體進行快速精確優化。本發明專利技術具有建模智能化與自動化、擬合和預測精度高、方法適應性廣等優點;可用于環境健康風險診斷、自然災害損失評估和現場抽樣調查等項目中的人口信息精確獲取。
【技術實現步驟摘要】
本專利技術涉及,可用于環境健康風險診斷、自然災害損失評估和現場抽樣調查等項目中的人口信息精確獲取。
技術介紹
人口增長已經給全球資源、環境承載能力造成了巨大壓力耕地和林地面積驟減,生態多樣性破壞嚴重,人類生存條件日益惡化等。及時獲取不同尺度上精確的人口空間分布及其變化信息對于解決這些社會、經濟和環境問題,提高人口、資源和環境的綜合管理能力有著重要意義。而人口數據通常是按照行政單元來逐級統計和匯總的。這種統計方法往往造成研究中人口和其它數據所依附的空間單元尺度不同,使得數據間融合成為難題。另外由于人口的增長和遷移,還需要大量的精力和財力來維持人口信息的實時性。因此非常必要將人口普查數據進行空間化,通過建模來模擬人口真實的空間分布狀況和動態變遷的過程。自從1857年第一張人口密度等值線圖產生之后,人口數據空間化研究迅速發展起來。人口數據空間化研究方法分為兩大類面插值和曲面建模。面插值是將人口數據在不同的面域單元內進行轉換,目的是將源區(source zone)的人口普查數據轉換到目標區(target zone)上。而人口分布曲面建模則是利用適當的公式將普查數據分配到一個規則的格網系統中去,系統中的每個格網都包含了一個其特定位置的人口估算值。雖然人口空間化方法能提供大量人口空間分布和變化信息,但是它們都不可避免地存在一個難題-尋找影響因子和人口數據之間的數學關系。在國內外很多此類研究中是通過建立因子和人口之間線性或非線性回歸模型的方法來實現人口空間化的。逐步回歸是求取回歸模型最為常用的方法之一。它是一種“有進有出”的許算方法,按照變量的重要性來逐一選出重要變量,而且還考慮到已入選回歸方程的某些變量有可能隨著其后另一些變量選入而失去原有的重要性,及時地把這些變量從回歸方程中剔除出去,最終的回歸方程只保留重要的變量。逐步回歸分析等常用的建模方法雖然操作簡單,結果便于解釋,但是要求預先定義模型結構和模型參數,這個往往是很難確定。另外,還有一些其它學科的成熟模型,例如物理學上的重力模型被成功用來人口數據空間化。重力模型在人口空間化中運用的前提是假設人們都趨于在或靠近城市的地方生活,不然其生活區域與城市中心有很好的連接;即使在農村,人口密集區多靠近交通干線,而且越靠近城區,人口密度越要比腹地高。這種建模方法雖然只要對重力模型進行略微調整就能以此得到每個格網上的人口數,但是選擇哪些人口分布影響因子變量輸入模型同樣也是個難題。如果集中分析模型中某一因子變量,往往容易引入偏倚。總體來說,上述有關人口數據空間化的建模方法具有精度低、模型優化效果差的不足。
技術實現思路
本專利技術的技術解決問題是克服現有人口數據空間化建模精度低、模型優化效果差的不足,提供一種在遺傳規劃算法和改進遺傳算法相嵌套基礎上的人口數據空間化動態建模方法,該方法具有建模精度高,模型優化效果好的優點。本專利技術的技術解決方案為,其特點在于首先處理對人口空間分布產生影響的n種自然和社會經濟因素的原始數據,得出這些數據的歸一化值;后將影響因素歸一化值作為遺傳規劃算法(genetic programming,GP)輸入,組成搜索空間,來快速求解具有最佳適應度的人口數據空間化模型;在GP算法每代個體選擇復制操作過程中利用改進遺傳算法(genetic algorithms,GA)對待復制個體進行優化,最終實現人口數據空間化動態建模的目的,其具體步驟如下 (1)利用GIS技術獲取對人口分布具有影響的自然和社會經濟因素的原始數據,對這些數據進行歸一化處理;(2)初始化遺傳規劃算法和改進遺傳算法參數;(3)將各種影響因素的歸一化值作為遺傳規劃算法的輸入,組成搜索空間,來求解具有最佳適應度的人口數據空間化模型;在遺傳規劃算法每代個體選擇復制操作過程中利用改進遺傳算法對待復制個體進行快速精確優化,最終實現人口數據空間化動態建模。所述的初始化遺傳規劃算法參數有種群規模,即種群中的個體數GP_Size、樣本量GP_N、遺傳代數GP_Gen、最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和變異概率GP_Pm;初始化改進遺傳算法參數有種群規模,即種群中的個體數GA_Size、樣本數目GA_N和遺傳代數GA_Gen;然后用遺傳規劃算法和改進遺傳算法相嵌套的方法快速求解具有最佳適應度的人口數據空間化模型,即A.首先確定遺傳規劃算法搜索空間中的基本組成單元,包括n種影響因素歸一化值的基本算子(f1,f2,...,fn)和基本算術運算符,再由基本組成單元隨機形成GP_Size個個體。這些個體都是人口數據空間化模型的備選方案,即人口分布和輸入影響因素變量之間的可能的數學關系表達式,一般具有以下函數形式POPU=f(X1f1,X2f2,...,Xnfn)(1)式中POPU為人口數據變量;(f1,f2,...,fn)和(X1,X2,...,Xn)分別為各類輸入影響因素變量及其系數。B.計算針對個體Kpid(i)_GP(1≤i≤GP_Size)的所有樣本計算理論值與實測值之間的決定系數,將其作為第t代(1≤t≤GP_Gen)中該個體的適應度BsJi(i,t)_GP,其計算公式為 BsJi(i,t)_GP=Σj=1GP_N(P_GP(j)-P‾)(P′_GP(j)-P′‾)Σj=1GP_N(P_GP(j)-P‾)2Σj=1GP_N(P′_GP(j)-P′‾)2---(2)]]>式中 和 分別為所有樣本實測值和計算理論值的平均值;P′_GP(j)為個體Kpid(i)_GP在樣本j(1≤j≤GP_N)的計算理論值;P_GP(j)為樣本j的實測值;C.根據公式(2)所確定的適應度,采取競爭選擇策略來選擇復制個體以產生新個體,即隨機從群體中選取一組個體,比較該組每個成員的適應度,選出實際最好的個體Kpid(BesOpt)_GP,即POPU=f(XB1f1,XB2f2,...,XBnfn),在利用改進遺傳算法對其進行快速精確地優化后,復制優化后的個體以取代該組最差的。用改進遺傳算法對個體組中最優個體進行優化的步驟如下a.首先對模型結構進行判別,若屬于已經優化過的結構則不再優化。b.采用實數編碼方式,直接用樣本中實際數據的實數類型,根據整體誤差模型中待優化的模型系數(XB1,XB2,...,XBn),隨機生成初始群體中GA_Size個個體;c.建立改進遺傳算法的適應度評價函數,計算針對個體Kpid(i)_GA(1≤i≤GA_Size)的所有樣本的計算理論值與實測值之間方差的總和,將其作為第t代(1≤t≤GA_Gen)中該個體的適應度BsJi(i,t)_GA,計算公式為BsJi(i,t)_GA=1GA_Size×Σj=1GA_GN(P′_GA(j)-P_GA(j))2Σi=1GA_SizeΣj=1GA_GN(P′_GA(j)本文檔來自技高網...
【技術保護點】
一種人口數據空間化動態建模方法,其特征在于包括以下步驟: (1)利用GIS技術獲取對人口分布具有影響的自然和社會經濟因素的原始數據,對這些數據進行歸一化處理; (2)初始化遺傳規劃算法和改進遺傳算法參數; (3)將步驟(1)歸一化值后的有關原始數據作為遺傳規劃算法的輸入,組成搜索空間,來求解具有最佳適應度的人口數據空間化模型;在遺傳規劃算法每代個體選擇復制操作過程中利用改進遺傳算法對待復制個體進行快速精確優化,最終實現人口數據空間化動態建模。
【技術特征摘要】
【專利技術屬性】
技術研發人員:王勁峰,廖一蘭,
申請(專利權)人:中國科學院地理科學與資源研究所,
類型:發明
國別省市:11[中國|北京]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。