System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于移動群智感知的多源數據融合領域,特別涉及群智感知如何集成來自各種來源的數據,從而構建高質量的數據采集服務的方法。
技術介紹
1、移動群智感知是一種流行且高效的多源數據采集模式,由三個主要組成部分組成:感知數據的移動工人,進行數據處理、提供感知服務的感知平臺,以及需要使用感知服務并為之付費的請求者。面對移動群智感知采集到的大量多源數據,多源數據融合在構建高質量的數據采集服務中起著至關重要的作用。多源數據融合集成來自各種來源的數據,如部署的傳感器、無人機和移動車輛,以產生可靠的融合結果,從而提高移動群智感知在提供高質量數據收集服務方面的有效性。
2、為了從相互沖突的多源數據中提取真實信息,移動群智感知中廣泛采用了一系列真相發現方法用于多源數據融合。現有的真相發現方法通常依賴于假設大多數工作人員(即傳感源)是可信的,因此估計的真值將趨于可信。然而,即使大多數工人是可信的,來自一小部分不可信工人的錯誤數據仍然會影響當前真相發現方法的最終結果,從而產生偏差。更關鍵的是,它的不準確性隨著不可信工作者比例的增加而增加,當不可信或惡意工作者超過大多數時,攻擊者可以操縱融合結果。
3、另一方面,移動群智感知中應用了一些真相恢復方法來解決數據稀疏性問題,這些方法利用感知數據之間的時空相關性來恢復或推斷未感知數據。這些方法假設只能收集到一小部分可信數據,旨在恢復(即推斷)未感知的數據。然而,這些方法面臨著與真相發現類似的挑戰,即存在不可信的工人。如果感知平臺錯誤地采用惡意工作者偽造的數據作為基線來恢復感知矩陣,則
4、因此,本專利技術的方法就是提出一種有效的無人機輔助的多源數據融合真相發現方法,并通過數據恢復解決稀疏真相問題,同時利用獲得的真相有效評估工人可信度,是一種有效的解決方法。
技術實現思路
1、本專利技術公開了一種基于交叉驗證的可靠多源數據融合方法。本專利技術方法針對當前群智網絡中在不可信的環境中獲得可信的真實數據,以提供高質量的數據收集服務而提出。具體而言,本專利技術首先根據工人報價和工人信任度招募工人;然后根據招聘結果選擇特定任務派遣無人機進行主動數據采集,獲取完全可信的真相數據;隨后,本專利技術根據招募工人的數據為其他任務計算估計真相,減輕了招聘不可信的員工對數據不可避免的負面影響。獲得無人機數據和工人估計真相后,平臺使用深度矩陣分解方法捕獲稀疏數據矩陣中數據的時空相關性,補全稀疏數據矩陣中的稀缺值;最后,平臺利用融合真相數據對工人數據評估并更新工人信任度,從而更準確地逐輪識別可信工人。
2、專利技術的技術解決方案如下:
3、一種基于交叉驗證的可靠多源數據融合方法,其特征在于包括以下步驟:
4、(1)感知服務請求者將m個任務以及總預算提交給感知平臺。任務分為多輪進行,輪數用t∈{1,2,…}表示。感知平臺中有n個未知工人,用表示。在每一輪感知平臺將任務釋放,工人向感知平臺提交在第t輪感興趣的任務以及完成這些任務聲稱的成本bi,t;被選中的工人將執行任務并報告數據,表示工人wi在第t輪的可信度;接下來感知平臺將通過下面方法獲得可靠數據真相;
5、(2)首先,每個工人會向平臺發送希望在第t輪執行的任務集合以及聲稱的成本bi,t,平臺會計算工人計算每個工人的可信度-成本比:
6、
7、在最初階段,平臺會將工人的可信度設置為0.5,以平等地招募未知工人來估計其可信度;然后,平臺會選擇根據可信度-成本比vi,t排序的前k個工人,并設置平臺給予完成任務的工人一定獎勵。
8、(3)在第t輪招募工人后,我們用λi,t∈{0,1}來估計被招募的工人wi是否可信:
9、
10、其中是一個可信度閾值,例如可以設置為0.5;當λi,t=1時,平臺認為工人wi在第t輪是可信的,否則是不可信的;然后,感知平臺會無人機以協助數據收集和工人的可信度驗證;采用無人機進行數據收集有如下二種情況:一種是缺乏工人參與但對數據恢復推理至關重要的任務;另一種是涉及可疑的惡意工人參與的任務;平臺每輪會對x個任務派遣無人機,具體如下:
11、派出無人機針對缺乏工人參與但對數據恢復推理至關重要的任務進行數據收集的方法如下:感知平臺首先計算每個任務的歷史經驗分數
12、
13、其中,τ表是一個整數超參數,和分別表示感知平臺是否在第t輪為任務tj派出無人機和招募可信工人。表示工人wi在第t輪是否被招募執行任務tj;平臺會選擇歷史經驗分數sj,t較低的前個任務派遣無人機;
14、派出無人機針對缺乏工人參與但對數據恢復推理至關重要的任務進行數據收集的方法如下:感知平臺計算每個任務的質量預測分數
15、
16、平臺也會選擇質量預測分數uj,t較低的前個任務派遣無人機;
17、(4)然后,平臺會根據來自工人和無人機的數據計算真相;平臺認為無人機執行任務收集的數據是完全可信的,因此直接作為真相;而對于工人收集的數據,感知平臺利用一種加權均值的方法進行真相發現,真相發現方法迭代進行權值更新和真值聚合兩個階段。在權值更新階段,每個工人wi為任務tj報告的數據的權重根據當前的估計真相計算,表示工人wi在第t輪為任務tj收集的數據,計算公式如下
18、
19、表示兩者間的距離;在真相聚合階段,我們對可信工人提交的數據進行加權平均,更新估計真相數據dj,t,更新公式如下:
20、
21、感知平臺首先初始化真相數據,迭代地進行權值更新和真值聚合,直到滿足收斂準則;
22、(5)接下來,感知平臺將使用深度矩陣分解方法捕獲稀疏數據矩陣的時空相關性,補全稀疏矩陣中的缺失數據,獲得多源數據融合可靠真相;感知平臺首先使用從第max(t-τ+1,1)輪到第t輪的無人機數據和可信工人計算真相構建稀疏矩陣然后隨機初始化時空相關性矩陣函數f(·)表示數據之間的相關性,則平臺可以用時空相關性矩陣擬合稀疏矩陣那么真相恢復的優化目標可以表示為:
23、
24、其中ψ′是一個二元矩陣,如果原稀疏矩陣在[i,j]處有無人機數據或者可信工人真相,則ψ′[i,j]=1;否則,ψ′[i,j]=0。是限制矩陣z的正則化懲罰項防止網絡過擬合,γπ(f)表示對f(·)的懲罰。
25、深度矩陣分解采用深度結構化神經網絡,假設有h個隱藏層,神經網絡的參數表示為:
26、
27、神經網絡的每一層表示如下:
28、
29、懲罰項π(f)與權重矩陣ωx和bx相關聯,其中,權重矩陣ωx的影響最大。因此,π(f)可以表示為:
30、
31、對神經網絡進行訓練后,感知平臺得到參數ωx和bx推導出非線性映射f(·)的表達式;從而使用進行矩陣補全稀疏矩陣使得每個任務都有估計的融合真相;
32、(6)最后,感知平臺將工本文檔來自技高網...
【技術保護點】
1.一種基于交叉驗證的可靠多源數據融合方法,其特征在于包括以下步驟:
【技術特征摘要】
1.一種基于交叉驗證的可靠多源數據...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。