System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機,特別涉及人工智能,尤其涉及一種基于貪心算法的用戶畫像最優屬性組確定方法和裝置。
技術介紹
1、在互聯網時代,數據驅動信息的流動。各行各業通過數據分析挖掘商機,數據日益成為一種資產財富,但是數據的獲取是有成本的。用戶畫像的構建需要大量屬性數據,基于數據是一種資產的思想,多指標必然會帶來高成本,但同時也會構建更完善的用戶畫像。因此,一個用戶畫像的構建需要考慮到數據成本與屬性數據兩者間的平衡。相關技術中,用戶畫像屬性選擇方案側重于挖掘數據本身的價值或者僅關注數據數量,若僅關注數據本身的價值,忽略企業對數據的獲取成本,會造成數據成本過高;若僅關注數據數量,直接獲取海量數據源信息進行直接處理,導致資源消耗高,最終形成的用戶畫像屬性組的可能不是最優選擇,應用性能較差。
技術實現思路
1、本專利技術的一個目的在于提供一種基于貪心算法的用戶畫像最優屬性組確定方法,能夠在一定數據成本下,將數據的信息量最大化,平衡了數據成本和信息價值,降低了資源消耗和數據成本,提高數據價值,從而提高了最終形成的用戶畫像最優屬性組的應用性能。本專利技術的另一個目的在于提供一種基于貪心算法的用戶畫像最優屬性組確定裝置。本專利技術的再一個目的在于提供一種計算機可讀介質。本專利技術的還一個目的在于提供一種計算機設備。
2、為了達到以上目的,本專利技術一方面公開了一種基于貪心算法的用戶畫像最優屬性組確定方法,包括:
3、根據用戶畫像數據源,確定出樣本數據,樣本數據包括多個屬性指標;
4、通過熵權法,根據樣本數據,生成信息權重數據;
5、通過熵權法,根據獲取的屬性指標的成本評分數據,生成成本權重數據;
6、基于貪心算法,根據信息權重數據和成本權重數據,生成用戶畫像的最優屬性組。
7、優選的,通過熵權法,根據樣本數據,生成信息權重數據,包括:
8、通過極值法對樣本數據進行無量綱化處理,生成無量綱樣本矩陣;
9、對無量綱樣本矩陣進行平移處理,生成平移后的無量綱樣本矩陣;
10、對平移后的無量綱樣本矩陣進行標準化處理,生成信息權重數據。
11、優選的,樣本數據包括每個屬性指標對應的樣本屬性值;
12、通過極值法對樣本數據進行無量綱化處理,生成無量綱樣本矩陣,包括:
13、根據樣本數據,獲取屬性指標的最大值和最小值;
14、根據屬性指標的樣本屬性值、最大值和最小值,生成屬性指標的無量綱樣本屬性值;
15、根據多個屬性指標和每個屬性指標的無量綱樣本屬性值,生成無量綱樣本矩陣。
16、優選的,對平移后的無量綱樣本矩陣進行標準化處理,生成信息權重數據,包括:
17、根據平移后的無量綱樣本矩陣中每個無量綱樣本屬性值,生成特征比重矩陣;
18、根據特征比重矩陣進行熵值計算,生成屬性熵值矩陣,屬性熵值矩陣包括多個屬性指標和每個屬性指標的熵值;
19、對屬性熵值矩陣進行差異性系數計算,生成差異性系數矩陣,差異性系數矩陣包括多個屬性指標和每個屬性指標的差異性系數;
20、根據差異性系數矩陣,生成信息權重數據,信息權重數據包括多個屬性指標和每個屬性指標的信息權重。
21、優選的,成本評分數據包括多個屬性指標和每個屬性指標對應的成本評分值;
22、通過熵權法,根據獲取的屬性指標的成本評分數據,生成成本權重數據,包括:
23、通過極值法對成本評分數據進行無量綱化處理,生成無量綱成本矩陣;
24、對無量綱成本矩陣進行平移處理,生成平移后的無量綱成本矩陣;
25、對平移后的無量綱成本矩陣進行標準化處理,生成成本權重數據。
26、優選的,基于貪心算法,根據信息權重數據和成本權重數據,生成用戶畫像的最優屬性組,包括:
27、根據信息權重數據和成本權重數據,生成單位成本信息;
28、按照單位成本信息,對屬性指標進行排序,生成排序后的屬性指標;
29、根據預設的實際成本值和實際指標數量進行初始化,生成初始化狀態;
30、通過預設的狀態轉移方程,根據初始化狀態和成本權重數據,對排序后的屬性指標進行遍歷,生成用戶畫像的最優屬性組。
31、本專利技術還公開了一種基于貪心算法的用戶畫像最優屬性組確定裝置,包括:
32、樣本數據確定單元,用于根據用戶畫像數據源,確定出樣本數據,樣本數據包括多個屬性指標;
33、信息權重生成單元,用于通過熵權法,根據樣本數據,生成信息權重數據;
34、成本權重生成單元,用于通過熵權法,根據獲取的屬性指標的成本評分數據,生成成本權重數據;
35、最優屬性組生成單元,用于基于貪心算法,根據信息權重數據和成本權重數據,生成用戶畫像的最優屬性組。
36、本專利技術還公開了一種計算機可讀介質,其上存儲有計算機程序,該程序被處理器執行時實現如上所述方法。
37、本專利技術還公開了一種計算機設備,包括存儲器和處理器,所述存儲器用于存儲包括程序指令的信息,所述處理器用于控制程序指令的執行,所述處理器執行所述程序時實現如上所述方法。
38、本專利技術還公開了一種計算機程序產品,包括計算機程序/指令,計算機程序/指令被處理器執行時實現如上所述方法。
39、本專利技術根據用戶畫像數據源,確定出樣本數據,樣本數據包括多個屬性指標;通過熵權法,根據樣本數據,生成信息權重數據;通過熵權法,根據獲取的屬性指標的成本評分數據,生成成本權重數據;基于貪心算法,根據信息權重數據和成本權重數據,生成用戶畫像的最優屬性組,能夠在一定數據成本下,將數據的信息量最大化,平衡了數據成本和信息價值,降低了資源消耗和數據成本,提高數據價值,從而提高了最終形成的用戶畫像最優屬性組的應用性能。
本文檔來自技高網...【技術保護點】
1.一種基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述通過熵權法,根據所述樣本數據,生成信息權重數據,包括:
3.根據權利要求2所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述樣本數據包括每個屬性指標對應的樣本屬性值;
4.根據權利要求2所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述對所述平移后的無量綱樣本矩陣進行標準化處理,生成所述信息權重數據,包括:
5.根據權利要求1所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述成本評分數據包括多個屬性指標和每個屬性指標對應的成本評分值;
6.根據權利要求1所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述基于貪心算法,根據所述信息權重數據和成本權重數據,生成用戶畫像的最優屬性組,包括:
7.一種基于貪心算法的用戶畫像最優屬性組確定裝置,其特征在于,所述裝置包括:
8.一種計算機可讀介質,
9.一種計算機設備,包括存儲器和處理器,所述存儲器用于存儲包括程序指令的信息,所述處理器用于控制程序指令的執行,其特征在于,所述程序指令被處理器加載并執行時實現權利要求1至6任一項所述的基于貪心算法的用戶畫像最優屬性組確定方法。
10.一種計算機程序產品,包括計算機程序/指令,其特征在于,所述計算機程序/指令被處理器執行時實現權利要求1至6任一項所述的基于貪心算法的用戶畫像最優屬性組確定方法。
...【技術特征摘要】
1.一種基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述通過熵權法,根據所述樣本數據,生成信息權重數據,包括:
3.根據權利要求2所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述樣本數據包括每個屬性指標對應的樣本屬性值;
4.根據權利要求2所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述對所述平移后的無量綱樣本矩陣進行標準化處理,生成所述信息權重數據,包括:
5.根據權利要求1所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特征在于,所述成本評分數據包括多個屬性指標和每個屬性指標對應的成本評分值;
6.根據權利要求1所述的基于貪心算法的用戶畫像最優屬性組確定方法,其特...
【專利技術屬性】
技術研發人員:畢國耀,
申請(專利權)人:中國工商銀行股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。