System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據分析預測,具體是多模態數據分析的在園游客監測和預測方法及其系統,基于融合不同模態數據分析及多模型集成的景區實時在園游客數量監測及預測的方法。
技術介紹
1、國內大眾持續增長的旅游需求讓旅游目的地的游客數量保持高位運行,激增的客流帶來經濟增長的同時,也帶來了一系列的挑戰,客流量的激增給景區設施帶來巨大壓力,嚴重影響游客的旅游感知。準確的旅游客流量統計能夠改善景區管理能力,降低客流量激增所帶來的負面影響,保證景區的持續健康發展。目前旅游目的地在旅游公共服務的基礎設施上做了大量投入,依然不能準確感知客流量及景區客流密度。目前大景區和開放景區通過單一的數據源統計得到的景區實時在園數據往往和實際情況差距巨大,由于單一的數據源缺少數據積累和大數據分析能力,無法挖掘游客出行規律,而通過多個簡單數據源的組合和預測得到的實時在園游客數據,更加契合實際情況和數據分析的需要,因此結合多個數據源及客流影響因素,對時在園游客預測和分析變得十分必要。本次專利技術是通過手機信令數據、交通卡口、視頻監控、景區wifi-熱點、天氣數據等單一數據源組合對游客行為進行分析和實時在園游客預測和分析,為旅游市場管理規范化和游客出行引導智能化提供數據支撐。
技術實現思路
1、本專利技術組合單一的數據源統計數據通過多模型融合得到景區實時在園游客數據,與傳統的通過相比于單一數據源的游客在園數據統計有更高的準確性和實時性,能夠客觀真實不受人工干涉的反映出景區當前實際情況。切實的解決了大景區和開發景區的客流統計的難
2、多模態數據分析的在園游客監測預測方法,包括如下步驟:
3、s1,多模態數據提取及預處理;采用信令數據獲取景區周邊的運營商基站的用戶接入量,采用帶模式識別算法的設備獲取景區周邊交通卡口的車輛車型、數量等信息,接通景區關鍵區域的監控視頻,通過視頻分析算法獲取景區關鍵區域內游客的數量等信息,通過接口獲取景區wifi數據,獲取接入景區wifi系統游客的數量信息,提取景區環境檢測設備符合gb?3095-2018標準的環境檢測設備或權威部門的實時天氣信息,獲取到景區當前環境及天氣情況;
4、s2,多模態特征提取與特征向量融合
5、通過運營商提供的景區信令數據、交通卡口、視頻監控、景區wifi-熱點、天氣數據等多模態的數據,通過使用景區最大游客承載量為數據最大值,0為最小值,對信令數據、交通卡口、視頻監控、景區wifi熱點數據、天氣數據的噪聲、缺失值和異常值進行預處理,最后對數據進行z-score?標準化后,z-score標準化?是一種常見的數據處理方法,通過將數據按屬性減去其均值,并除以其標準差,公式為:其中是標準化后的值,
6、是原始數據,是均值,是標準差;使得每個屬性的數據都聚集在0附近,且方差為1;數據標準化后特征值作為它們的特征子向量,最后,按照{時間、信令數據特征子向量、在園車輛特征子向量、wifi數據特征子向量、視頻監控特征子向量、天氣特征子向量}的順序拼接起來,形成一個完整特征向量;
7、s3,多模型堆疊集成
8、模型的建立分為兩個部分:子模型建立和多模型集成;將描述景區即時狀態的特征,分別輸入到基于梯度提升算法的決策樹模型和深度神經網絡模型這兩個子模型中,基于兩個子模型的預測結果建立一個集成模型,最終使用該集成模型計算獲得景區的實時客流量。
9、其中,模型建立方法如下:
10、(1)建立梯度提升決策樹模型
11、使用lightgbm基于決策樹算法的分布式梯度提升框架,構建梯度提升決策樹模型
12、輸入:樣本集,,其中d為樣本采集時間,?n為樣本的總數;
13、輸出:梯度提升決策樹模型
14、初始化決策數;設置梯度提升決策樹模型訓練的決策樹的總數為m,分別對m=1?,2?,...,m,計算每個樣本的殘差;那么該樣本的殘差定義為;,i=1,2,……,n;n為樣本的總數,通過使用回歸決策樹模型擬合每個樣本的殘差;學習得到第m棵決策樹,其中為第m棵決策樹中的參數;
15、得到梯度提升決策樹模型,其輸出就是使用梯度提升決策樹模型預測出的景區實時在園游客數量;
16、(2)建立深度神經網絡模型:使用keras框架搭建長短期記憶lstm神經網絡模型;將信令數據、在園車輛數據、wifi數據、視頻監控數據、天氣數據按特征數據中所有的數值類型的數據進行標準化,構建模型時批次的維度不需要展示設為none,保證輸入層與訓練數據集的shape一致,即輸入層的shape為[none,14,6],再通過reshape對維度進行調整為[none,14,6,1]這樣就后續進行二維卷積操作;對卷積層設置參數濾波器的數量、卷積核kernel的大小和正則化,同時設置padding=same來對輸入進行0值填充。使用bn層對批次進行標準化可以加快模型的訓練速度,緩解梯度的消失并服從正態分布;批標準化后添加relu激勵層,使求梯度變得更簡單,提升收斂速度,再用池化進一步放大特性信息,此時卷積網絡完成后提取到了特征之間的空間關系;卷積完成后,對卷積通道進行1*1調整;卷積過程結束后,先通過squeeze層降一個維度,使得shape由四維變成三維后就運用lstm,其中第一層處理輸入序列并返回每一個時間步驟的輸出序列,第二層處理第一層的輸出序列并返回整個序列的單個輸出,來處理數據的時間序列信息。然后添加一個包含64個神經元的dense層對輸入數據進行非線性變換并學習輸入特征與輸出存在的非線性關系,在最后,使用全連接層作為輸出層;
17、基于兩個子模型的預測結果建立一個多模型集成模型:使用scikit-learn?庫創建決策樹回歸模型;對于訓練集中的所有樣本,,將分別輸入訓練后的梯度提升決策樹模型得到預測結果和深度神經網絡模型g(t)得到預測結果,構建出集成模型的新的訓練樣本集,在新的樣本集所在的輸入空間中,使用最小二乘法對切分變量與遍歷并計算每個切分點的損失值,選擇具有最小損失值的切分變量及切分點,遞歸地將每個區域劃分為兩個子區域并決定每個子區域上的輸出值,構建回歸決策樹模型,該模型的輸出就是預測的景區實時在園游客數量。
18、多模態數據分析的在園游客監測預測方法,所述s2多模態數據分析、特征提取與特征融合包括:
19、b1?.采集該景區運營商提供的基于信令數據計算的游客數量,提取信令數據特征;
20、其中n表示第n個基站接入人數,對數據進行z-score?標準化,構成信令數據特征子向量;
21、b2?.分析交通卡口數據,提取在園車輛特征:分別提取交通卡口進入景區和離開景區的車輛及車型信息,從進入的車輛數據中,剔除離開的車輛;推算出在園車輛及車型,再根據車型和人數對應系數推算人數,其中n表示車型,表示駛入區域第i個車型數量,表示駛離區域的第i個車型的數量,對數據進行z-score?標準化后,構成在園車本文檔來自技高網...
【技術保護點】
1.多模態數據分析的在園游客監測預測方法,其特征在于包括如下步驟:
2.根據權利要求1所述的多模態數據分析的在園游客監測預測方法,其特征在于,所述S2多模態數據分析、特征提取與特征融合包括:
3.根據權利要求1或2所述的多模態數據分析的在園游客監測預測方法的系統,其特征在于,所述系統為深度神經網絡模型;
【技術特征摘要】
1.多模態數據分析的在園游客監測預測方法,其特征在于包括如下步驟:
2.根據權利要求1所述的多模態數據分析的在園游客監測預測方法,其特征在于,所述s2多...
【專利技術屬性】
技術研發人員:王萬明,向振陸,張志東,李曉東,
申請(專利權)人:中電萬維信息技術有限責任公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。