System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及計算機,具體涉及一種模型訓練方法、廣告投放處理方法、模型訓練裝置、廣告投放處理裝置、計算機程序產品和電子設備。
技術介紹
1、隨著互聯網技術的發展,通過互聯網獲取信息,生活、娛樂和工作成為人們生活的一部分。商家為了提高知名度,推廣商品,往往通過互聯網投放廣告,互聯網在線廣告已成為除電視和報紙之外的主要廣告投放方式。對于推廣方,推廣方期望將廣告針對性的推薦給目標群體,提供給用戶感興趣的產品。對于用戶,用戶期望能夠針對性的獲取廣告推薦,這樣用戶可以直接獲取針對自身感興趣的商品的廣告。目前涌現很多用于推薦廣告的機器學習模型。
2、然而,目前隨著模型的訓練和應用模型進行廣告推薦,存在泄露用戶數據、數據被非法獲取或濫用的問題。
3、需要說明的是,在上述
技術介紹
部分專利技術的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
技術實現思路
1、本公開的目的在于提供一種模型訓練方法、廣告投放處理方法、模型訓練裝置、廣告投放處理裝置、計算機程序產品和電子設備,進而至少在確保用戶數據安全的情況下,提高廣告投放模型的準確性。
2、根據本公開的第一方面,提供一種模型訓練方法,包括:對原始數據集進行匿名化處理,得到匿名數據集,并根據匿名數據集確定初始特征集;對初始特征集中特征的重要性進行評估,得到重要性評估結果;向重要性評估結果中添加隨機噪聲,并根據添加隨機噪聲后的重要性評估結果從初始特征集中確定特征子集;基于特征
3、在本公開一示例性實施例中,基于特征子集對廣告投放模型進行訓練,得到訓練完成的廣告投放模型,包括:基于特征子集獲取廣告投放模型的網絡參數的梯度;向網絡參數的梯度中添加噪聲,并利用添加噪聲后的網絡參數的梯度對廣告投放模型的參數進行更新。
4、在本公開一示例性實施例中,在向網絡參數的梯度中添加噪聲之前,方法還包括:基于預設的梯度裁剪閾值對網絡參數的梯度進行裁剪。
5、在本公開一示例性實施例中,對原始數據集進行匿名化處理,得到匿名數據集,包括:獲取預設的隱私預算和噪聲分布,并根據所述隱私預算確定第一噪聲規模;基于噪聲分布和第一噪聲規模,對原始數據集中的數據添加隨機噪聲,得到干擾數據;根據干擾數據確定匿名數據集。
6、在本公開一示例性實施例中,向重要性評估結果中添加隨機噪聲,并根據添加隨機噪聲后的重要性評估結果從初始特征集中確定特征子集,包括:基于預設的隱私預算向重要性評估結果中添加隨機噪聲,得到添加隨機噪聲后的重要性評估結果;將添加隨機噪聲后的重要性評估結果與預設評估閾值進行比較,并根據比較結果從初始特征集的特征中確定特征子集。
7、在本公開一示例性實施例中,基于重要性評估模型對初始特征集中特征的重要性進行的評估;基于預設的隱私預算向重要性評估結果中添加隨機噪聲,包括:獲取重要性評估模型對應查詢函數的敏感度信息;根據預設的隱私預算和敏感度信息確定第二噪聲規模;基于第二噪聲規模向重要性評估結果中添加隨機噪聲。
8、在本公開一示例性實施例中,在對原始數據集進行匿名化處理,得到匿名數據集之前,方法還包括:對初始數據集進行數據清洗;將數據清洗后的初始數據集進行標準化處理,得到標準化數據;對標準化數據進行數據增強處理,得到原始數據集。
9、根據本公開的第二方面,提供一種廣告投放處理方法,包括:獲取待處理廣告信息;將待處理廣告信息輸入至訓練完成的廣告投放模型,得到待處理廣告信息的處理結果;基于處理結果進行廣告投放處理。其中,訓練完成的廣告投放模型為基于上述中任一項的方法對廣告投放模型進行訓練得到的。
10、在本公開一示例性實施例中,基于處理結果進行廣告投放處理,包括:獲取處理結果對應的目標數據,目標數據至少包括廣告投放數據和用于訓練廣告投放模型的原始數據集;對原始數據集和廣告投放數據進行合規性檢測,以根據合規性檢測結果對處理結果進行廣告投放處理。
11、在本公開一示例性實施例中,方法還包括:根據合規性檢測結果,生成合規性檢測文件,合規性檢測文件至少包括潛在風險信息和潛在風險信息對應的位置信息。
12、根據本公開的第三方面,提供一種模型訓練裝置,包括:匿名處理模塊,用于對原始數據集進行匿名化處理,得到匿名數據集,并根據匿名數據集確定初始特征集;特征評估模塊,用于對初始特征集中特征的重要性進行評估,得到重要性評估結果;特征選取模塊,用于向重要性評估結果中添加隨機噪聲,并根據添加隨機噪聲后的重要性評估結果從初始特征集中確定特征子集;模型訓練模塊,用于基于特征子集對廣告投放模型進行訓練,得到訓練完成的廣告投放模型。
13、根據本公開的第四方面,提供一種廣告投放處理裝置,包括:信息獲取模塊,用于獲取待處理廣告信息;第一處理模塊,用于將待處理廣告信息輸入至訓練完成的廣告投放模型,得到待處理廣告信息的處理結果;第二處理模塊,用于基于處理結果進行廣告投放處理。其中,訓練完成的廣告投放模型為基于上述中任一項的方法對廣告投放模型進行訓練得到的。
14、根據本公開的一個方面,提供一種計算機程序產品,包括計算機程序,計算機程序被處理器執行時實現上述中的任一項的方法。
15、根據本公開的一個方面,提供一種電子設備,包括:處理器;以及存儲器,用于存儲處理器的可執行指令;其中,處理器配置為經由執行可執行指令來執行上述任意一項的方法。
16、本公開實施例所提供的技術方案中,一方面,對原始數據集進行匿名化處理,得到匿名數據集,并根據匿名數據集確定初始特征集,可避免初始特征集中存在泄露用戶隱私的數據信息。另一方面,對初始特征集中特征的重要性進行評估,得到重要性評估結果,向重要性評估結果中添加隨機噪聲,并根據添加隨機噪聲后的重要性評估結果從初始特征集中確定特征子集,能提取對于模型訓練的關鍵特征對廣告投放模型進行訓練,提高模型訓練的精度,并且添加隨機噪聲的方式增加數據隱私安全,進一步避免篩選數據過程中的隱私泄露。綜上,本公開的示例性實施例能在確保用戶數據安全的情況下,提高廣告投放模型的準確性。
17、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。
本文檔來自技高網...【技術保護點】
1.一種模型訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述特征子集對廣告投放模型進行訓練,得到訓練完成的廣告投放模型,包括:
3.根據權利要求2所述的方法,其特征在于,在所述向所述網絡參數的梯度中添加噪聲之前,所述方法還包括:
4.根據權利要求1所述的方法,其特征在于,所述對原始數據集進行匿名化處理,得到匿名數據集,包括:
5.根據權利要求4所述的方法,其特征在于,所述向所述重要性評估結果中添加隨機噪聲,并根據添加隨機噪聲后的重要性評估結果從所述初始特征集中確定特征子集,包括:
6.根據權利要求5所述的方法,其特征在于,基于重要性評估模型對所述初始特征集中特征的重要性進行的評估;
7.根據權利要求1至6中任一項所述的方法,其特征在于,在所述對原始數據集進行匿名化處理,得到匿名數據集之前,所述方法還包括:
8.一種廣告投放處理方法,其特征在于,包括:
9.根據權利要求8所述的方法,其特征在于,所述基于所述處理結果進行廣告投放處理,包括:
11.一種模型訓練裝置,其特征在于,包括:
12.一種廣告投放處理裝置,其特征在于,包括:
13.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至10任一項所述的方法。
14.一種電子設備,其特征在于,包括:
...【技術特征摘要】
1.一種模型訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述特征子集對廣告投放模型進行訓練,得到訓練完成的廣告投放模型,包括:
3.根據權利要求2所述的方法,其特征在于,在所述向所述網絡參數的梯度中添加噪聲之前,所述方法還包括:
4.根據權利要求1所述的方法,其特征在于,所述對原始數據集進行匿名化處理,得到匿名數據集,包括:
5.根據權利要求4所述的方法,其特征在于,所述向所述重要性評估結果中添加隨機噪聲,并根據添加隨機噪聲后的重要性評估結果從所述初始特征集中確定特征子集,包括:
6.根據權利要求5所述的方法,其特征在于,基于重要性評估模型對所述初始特征集中特征的重要性進行的...
【專利技術屬性】
技術研發人員:徐誠浪,
申請(專利權)人:北京京東遠升科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。