System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于數據挖掘和推薦,特別是涉及一種面向多行為稀疏數據的客戶轉化率預測方法。
技術介紹
1、隨著互聯網的飛速發展,電子商務已經成為現代經濟的重要組成部分。全球范圍內,越來越多的消費者選擇在線購物,電商平臺的交易額和客戶數量持續攀升。在這個數字化轉型的過程中,客戶的購買行為成為衡量電商平臺成功的重要指標。為了提升銷售額和客戶滿意度,電商平臺需要深入了解客戶行為及其背后的動機,特別是影響客戶從瀏覽商品到最終購買的各種因素。轉化率(cvr,conversion?rate)預測技術應運而生,通過分析和建模客戶行為數據,幫助平臺更精準地預測客戶購買的可能性,從而優化營銷策略和客戶體驗。
2、基于深度神經網絡的模型已經廣泛應用于轉化率預測,現有的方法主要分為兩大類。第一類基于客戶特征信息的序列數據,對客戶行為建模進行轉化率預測。這類方法的核心思想是利用客戶的歷史行為數據,特別是時序信息,來捕捉客戶在不同時間點的行為模式和偏好,從而提高預測的準確性。第二類方法關注客戶特征與物品(如廣告、商品)特征之間的交互關系,利用這些交互特征進行預測,其核心思想是通過挖掘客戶與物品特征之間的復雜關系,捕捉影響轉化率的關鍵因素。
3、然而,深度學習模型通常需要大量的訓練數據。在在線廣告系統中,盡管可能存在數百萬到數十億的廣告,但客戶通常只會點擊少部分廣告,并在更小的集合上產生轉化。這種數據稀疏性問題限制了深度模型的預測能力。此外,還有幾個關鍵問題進一步影響轉化率預測的精度和效果。首先是轉化樣本稀疏問題,正樣本過少導致模型訓練不
技術實現思路
1、本專利技術實施例的目的在于提供一種面向多行為稀疏數據的客戶轉化率預測方法,以優化節點的嵌入表示,增強對客戶興趣的建模能力,有效識別因轉化延遲導致的假負樣本問題。
2、為解決上述技術問題,本專利技術提供了一種面向多行為稀疏數據的客戶轉化率預測方法,按照以下步驟進行:
3、步驟s1:數據預處理,獲取客戶行為數據集,構建客戶特征信息的序列數據,并按照每一條記錄中的客戶編號、項目編號、是否點擊和是否發生轉換構建點擊和轉化客戶-項目交互圖數據;
4、步驟s2:定義轉換率預測模型cf4cvr,包括構建轉化率預測模型cf4cvr和任務定義,所述任務是通過客戶-項目特征信息s,客戶集合u,項目集合v以及多行為的交互圖a1,a2來預測發生點擊和轉換的概率;
5、步驟s3、使用s2中構建的客戶-項目特征信息s,客戶集合u,項目集合v以及多行為的交互圖a1,a2的數據集對cf4cvr模型進行訓練并保存訓練權重;
6、步驟s4、模型加載和預測,聲明cf4cvr模型并加載訓練權重,將客戶輸入到模型cf4cvr中,計算客戶和其他項目發生轉化的概率。
7、進一步的,所述步驟s1的客戶行為數據集包括客戶編號、項目編號、是否點擊、是否發生購買行為的轉換、項目類別、客戶性別、工作、地點和年齡。
8、進一步的,所述步驟s2的轉化率預測模型cf4cvr,包括seqpredict模型和graphpredict模型,seqpredict模型包含輸入嵌入層、字段池化層、多層感知機,通過歸一化模塊組成進行轉化率預測和點擊率預測;graphpredict模型包含輸入嵌入層、鄰居增強的圖卷積網絡、多任務學習模塊、級聯結構的跨行為建模模塊和對比學習模塊。
9、進一步的,所述步驟s3具體過程如下:
10、步驟s31、seqpredict模型使用客戶特征數據進行預測:輸入seqpredict模型的嵌入層和字段池化層將客戶特征信息的序列數據映射為向量并拼接后表示為x∈[n,d];
11、其中,n表示記錄數,d表示嵌入的維數,x表示從特征空間采用的特征嵌入向量;
12、進而,將向量經過多個線性層和非線性激活函數后進行歸一化得到seqpredict模型發生點擊概率和轉換的概率
13、步驟s32、graphpredict模型使用客戶-項目圖結構數據進行預測,具體過程如下:
14、使用圖卷積網絡,通過對節點進行輕量級的更新操作,聚集單行為圖內客戶項目的高階鄰居信息,并對不同層的輸出進行求和取平均的操作來優化節點嵌入表示,具體的:
15、
16、
17、其中fagg()為聚集函數,nu,k表示節點u在行為圖ak下的鄰居,表示客戶u在圖ak下第l層的嵌入表示,表示項目i在圖ak下第l-1層的嵌入表,e'u,k為對不同層進行平均池化后的最終表示,l=0表示第0層,l表示圖卷積網絡的層數;
18、進而,考慮到客戶交互的稀疏性,缺少足夠的鄰居信息和客戶監督信息,無法有效的對客戶偏好進行學習,本專利技術中圖卷積網絡一共三層,包括輸入、隱藏、輸出層,將其他兩層的嵌入作為當前層嵌入的鄰居信息并作為正樣本進行對比學習,用于加強客戶的監督信號。具體的說,同一節點在當前層和其他層的嵌入表示作為正樣本,具體的:
19、
20、表示在行為圖ak下客戶u在第l層的表示,表示行為圖ak下項目i在第l層的表示,τ是溫度系數,表示在行為圖ak下客戶v在圖卷積網絡下第0層的嵌入,表示在行為圖ak下項目i在圖卷積網絡下第0層的嵌入表示,表示在行為圖ak下項目j在圖卷積網絡下第0層的嵌入表示,表示在行為圖ak下客戶u在第0層的表示,表示通過鄰居增強方法和項目集合v在行為圖ak計算出來的損失,表示通過鄰居增強方法和客戶集合u在行為圖ak計算出來的損失,表示在行為圖ak通過鄰居增強方法計算出的損失;∑u∈u和∑v∈u表示對客戶集合u進行遍歷求和,其中u∈u和v∈u表示u和v是屬于u的一個項目,∑i∈v和∑j∈v表示對項目集合v進行遍歷求和,其中i∈v和j∈v表示i和j是屬于v的一個項目;
21、進而,為了充分利用輔助行為中的客戶偏好特征并緩解目標行為中的數據稀疏性,對客戶的級聯行為進行跨行為建模,當前行為圖下的客戶偏好輸出和前一個行為圖下的客戶偏好進行求和操作作為當前行為圖下的最終輸出:
22、eu,k=eu,k-1+e′u,k,ei,k=ei,k-1+e′i,k
23、其中,eu,k-1和ei,k-1分別表示節點u,項目i在行為圖ak-1下的表示,e'u,k和e'i,k分別表示節點u,項目i在行為圖ak的輸出,eu,k,ei,k為在行為圖ak下客戶-項目的最終嵌入表示;
24、進而,由于轉化延遲現象導致假負樣本問題,設計了一個對比學習模塊,將點擊行為學習到的客戶和項目的嵌入表示與轉換下的客戶和項目的嵌入表示進行聯合優化,具體的:
25、
...【技術保護點】
1.一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,步驟S1所述客戶行為數據集包括客戶編號、項目編號、是否點擊、是否發生購買行為的轉換、項目類別、客戶性別、工作、地點和年齡。
3.根據權利要求1所述的一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,所述轉化率預測模型CF4CVR,包括SeqPredict模型和GraphPredict模型,所述SeqPredict模型包含輸入嵌入層、字段池化層、多層感知機,通過歸一化模塊組成進行轉化率預測和點擊率預測;所述GraphPredict模型包含輸入嵌入層、鄰居增強的圖卷積網絡、多任務學習模塊、級聯結構的跨行為建模模塊和對比學習模塊。
4.根據權利要求1所述的一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,所述步驟S3具體過程如下:
5.根據權利要求4所述的一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,所述圖卷積網絡包括輸入、隱藏、輸出層,將其他兩層的嵌入作為當前層
...【技術特征摘要】
1.一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,步驟s1所述客戶行為數據集包括客戶編號、項目編號、是否點擊、是否發生購買行為的轉換、項目類別、客戶性別、工作、地點和年齡。
3.根據權利要求1所述的一種面向多行為稀疏數據的客戶轉化率預測方法,其特征在于,所述轉化率預測模型cf4cvr,包括seqpredict模型和graphpredict模型,所述seqpredict模型包含輸入嵌入層、字段池化層、多層感知機,通...
【專利技術屬性】
技術研發人員:張璇,蔡瑋,杜鯤鵬,王旭,謝紹衡,陳江彬,
申請(專利權)人:云南大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。