System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
【國外來華專利技術】
所公開的實現方式整體涉及數據可視化,并且更具體地涉及提供基于地點的語義相似度的系統、方法和用戶界面。
技術介紹
1、對象之間的相似度是直觀定義的。樹木與灌木相似,因為它們都是植物。然而,樹木與公寓樓并不相似,盡管通常使用高度來描述這兩者。從本質上講,理解事物相似的原因相當復雜且微妙。例如,研究人員已經研究了相似度的概念,目的是將其分解為特征以及人們各自理解和評估相似度的方式。
2、雖然在像樹木、灌木和公寓樓等對象之間的比較可能似乎是明顯且直觀的評估,但是當處理像種族、年齡和收入等各種社會人口統計特性時,標識相似度并不容易。這還取決于上下文以及對于個體解釋相似度而言重要的東西。就這些特性而言,美國的哪個區域與舊金山(san?francisco)最相似以及如何相似?就種族構成而言,芝加哥(chicago)的哪些街區與紐約州布朗克斯區(bronx,ny)最相似?
3、其他哪些位置像一個街區?如何像一個街區?為什么像一個街區?許多空間分析的核心是尋找位置之間的相似度或相異度。發現模式和解釋相似度是基于空間特性以及分配給地點的語義或含義兩者的一個復雜過程。人類對位置相似度的概念化是多方面的,并且無法通過對人口密度或中位收入等單個數字屬性的簡單評估來捕捉。然而,這些可量化屬性是對意義構建進行初步理解的基礎。
4、使用社會經濟和人口統計變量來測量相似度的一個困難在于可用數據數量巨大且種類繁多。在傳統的人口統計工作中,研究人員可以精選幾個簡單的變量諸如中位收入或年齡,并將它們用作其統計中的自變量來標識相關性。
技術實現思路
1、因此,需要促進結合相似度測量和空間分析來提供信息簡化和/或語義概括的系統、方法和界面。本文描述的技術有助于使用戶更接近可采取行動的洞察。可以在地理空間查詢中使用這些技術以確定區域之間的相似度,其中參與者可以操縱描述這些位置的各種屬性的各個權重。一些實現方式使用上下文和附加的地點特定參數來計算相似度。一些實現方式提供利用語義的細微差別的地理空間分析工具來獲取地點相似度。
2、一些實現方式使用統計方法來確定地理區域(例如,美國境內的區域)之間的相似度。一些實現方式提供了數據中樞,這使得用戶易于在其分析中結合這種類型的相似度測量。根據本文描述的技術的框架使得人們易于處理來自美國人口普查的各種屬性以使用用戶感興趣的屬性來標識或多或少相似的位置。一些實現方式使用基于jensen-shannon散度(jsd)的計算來確定相似度和/或在易讀地圖中呈現結果。一些實現方式在工具提示中按需示出細節。根據一些實現方式,下面詳細描述了使用jsd來評估相似度以進行數據分析。
3、根據一些實現方式,本文提供了一種用于對數據集的視覺分析的方法。方法在計算機系統處執行。用戶選擇數據源。作為響應,系統呈現用于分析數據源中的數據的圖形用戶界面。數據包括地理空間數據點。系統還在圖形用戶界面內呈現地圖數據可視化。地圖數據可視化包括多個地理區域。每個地理區域對應于相應的一個或多個地理空間數據點。響應于接收到選擇多個地理區域中的第一組的一個或多個地理區域的第一用戶輸入,系統使用一種或多種統計技術基于一組屬性(例如,來自數據源的數據字段)來計算多個地理區域中的第一組的一個或多個地理區域與第二組的一個或多個地理區域之間的相似度。然后,系統根據所計算的相似度來更新和顯示地圖數據可視化。
4、在一些實現方式中,一組屬性包括一個或多個社會經濟變量、人口統計變量和地理變量。
5、在一些實現方式中,更新地圖數據可視化包括突出或弱化第二組的一個或多個地理區域中的至少一個地理區域。
6、在一些實現方式中,方法還包括:響應于接收到在地圖數據可視化上選擇搜索多邊形的坐標的第二用戶輸入,基于坐標來定義第二一個或多個區域。
7、在一些實現方式中,方法還包括將搜索多邊形的坐標與多個地理區域中的地理區域中的每個的對應一個或多個地理空間數據點進行比較,以標識第二組的一個或多個地理區域。
8、在一些實現方式中,一組屬性中的每個屬性與多個權重中的對應權重相關聯,并且方法還包括基于多個權重來計算相似度。
9、在一些實現方式中,方法還包括提供一個或多個示能表示(affordance),每個示能表示對應于一組屬性中的相應屬性。
10、在一些實現方式中,方法還包括響應于接收到選擇一個或多個示能表示中的第一示能表示的第二用戶輸入:(i)調整對應于第一示能表示的第一屬性的第一權重以獲得經更新的權重集;(ii)使用一種或多種統計技術基于經更新的權重集來計算第一組的一個或多個地理區域與第二組的一個或多個地理區域之間的經更新的相似度;以及(iii)根據經更新的相似度來更新和顯示地圖數據可視化。
11、在一些實現方式中,方法還包括提供用于存儲經更新的權重集的存儲示能表示。響應于用戶選擇存儲示能表示,方法將經更新的權重集存儲在預設文件中用于下一會話。
12、在一些實現方式中,方法還包括:針對下一會話,獲取預設文件,并且使用經更新的權重集來計算第一組的一個或多個地理區域與第二組的一個或多個地理區域之間的相似度。
13、在一些實現方式中,地圖數據可視化是分級統計地圖,并且根據所計算的相似度來更新和顯示地圖數據可視化包括顯示從最大到最小相似度的梯度。
14、在一些實現方式中,方法還包括:(i)提供用于選擇分級統計地圖的第一示能表示和用于選擇最大-最小地圖(most-least?map)的第二示能表示;(ii)響應于對第一示能表示的用戶選擇,顯示從最大到最小相似度的梯度;以及(iii)響應于對第二示能表示的用戶選擇,顯示最大相似區域和最小相似區域。
15、在一些實現方式中,方法還包括:(i)提供多個示能表示,每個示能表示對應于相應的最大區域數量;以及(ii)響應于對多個示能表示中的示能表示的用戶選擇,基于對應于示能表示的最大區域數量來顯示第二組一個或多個區域內的最大相似區域和最小相似區域。
16、在一些實現方式中,方法還包括:(i)提供多個示能表示,每個示能表示對應于多個子區域中的相應子區域子集;以及(ii)響應于對多個示能表示中的示能表示的用戶選擇,(a)停止呈現地圖數據可視化以及(b)在圖形用戶界面內呈現替代地圖數據可視化。替代地圖數據可視化包括對應于示能表示的子區域子集。
17、在一些實現方式中,圖形用戶界面包括第一部分和第二部分,并且方法還包括:(i)在第一部分中顯示地圖數據可視化;以及(ii)在第二部分中顯示第一一個或多個地理區域與第二一個或多個地理區域之間的相似度的概述。
18、在一些實現方式中,每個地理區域對應于相應的人口普查區。
19、在一些實本文檔來自技高網...
【技術保護點】
1.一種對數據集進行視覺分析的方法,包括:
2.根據權利要求1所述的方法,其中所述數據字段集包括一個或多個社會經濟變量、人口統計變量和地理變量。
3.根據權利要求1所述的方法,其中更新所述地圖數據可視化包括突出或弱化所述第二一個或多個地理區域中的至少一個地理區域。
4.根據權利要求1所述的方法,還包括:
5.根據權利要求4所述的方法,還包括:
6.根據權利要求1所述的方法,其中所述數據字段集中的每個數據字段與多個權重中的對應權重相關聯,所述方法還包括:
7.根據權利要求6所述的方法,還包括:
8.根據權利要求7所述的方法,還包括:
9.根據權利要求8所述的方法,還包括:
10.根據權利要求9所述的方法,還包括:
11.根據權利要求1所述的方法,其中所述地圖數據可視化包括分級統計地圖,并且其中根據所計算的相似度而更新和顯示所述地圖數據可視化包括顯示從最大到最小相似度的梯度。
12.根據權利要求1所述的方法,還包括:
13.根據權利要求1所述
14.根據權利要求1所述的方法,還包括:
15.根據權利要求1所述的方法,其中所述圖形用戶界面包括第一部分和第二部分,所述方法還包括:
16.根據權利要求1所述的方法,其中每個所述地理區域對應于相應的人口普查區。
17.根據權利要求1所述的方法,其中計算所述相似度包括計算所述多個地理區域中的所述第一組的一個或多個地理區域和所述第二組的一個或多個地理區域針對所述數據字段集的語義相似度矩陣。
18.根據權利要求1所述的方法,其中計算所述相似度包括計算所述第一組的一個或多個地理區域和所述第二組的一個或多個地理區域中的地理區域對之間的Jensen-Shannon散度(JSD)。
19.一種用于數據集的視覺分析的計算機系統,包括:
20.一種非暫態計算機可讀存儲介質,其存儲被配置用于由具有顯示器、一個或多個處理器和存儲器的計算機系統執行的一個或多個程序,所述一個或多個程序包括用于以下操作的指令:
...【技術特征摘要】
【國外來華專利技術】
1.一種對數據集進行視覺分析的方法,包括:
2.根據權利要求1所述的方法,其中所述數據字段集包括一個或多個社會經濟變量、人口統計變量和地理變量。
3.根據權利要求1所述的方法,其中更新所述地圖數據可視化包括突出或弱化所述第二一個或多個地理區域中的至少一個地理區域。
4.根據權利要求1所述的方法,還包括:
5.根據權利要求4所述的方法,還包括:
6.根據權利要求1所述的方法,其中所述數據字段集中的每個數據字段與多個權重中的對應權重相關聯,所述方法還包括:
7.根據權利要求6所述的方法,還包括:
8.根據權利要求7所述的方法,還包括:
9.根據權利要求8所述的方法,還包括:
10.根據權利要求9所述的方法,還包括:
11.根據權利要求1所述的方法,其中所述地圖數據可視化包括分級統計地圖,并且其中根據所計算的相似度而更新和顯示所述地圖數據可視化包括顯示從最大到最小相似度的梯度。
12.根據權利要求1所述的方法...
【專利技術屬性】
技術研發人員:G·麥肯齊,S·E·巴特斯比,V·R·塞特勒,
申請(專利權)人:碩動力公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。