System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及數據處理,具體涉及一種實體圈選的方法、裝置、電子設備、存儲介質及程序產品。
技術介紹
1、隨著大數據技術的發展,目前通常運用大數據平臺的存儲計算能力,創建計算任務來實現實體圈選。
2、現有技術下,通常根據業務實際需求,實時從全量離線業務數據中,分別篩選出業務需要的每一實體包匹配的實體,并將各實體包中的實體分別存儲到不同的表中。
3、但是,采用這種實體圈選的方式,通常會耗費大量的計算資源以及存儲資源。
技術實現思路
1、本申請實施例的目的在于提供一種實體圈選的方法、裝置、電子設備、存儲介質及程序產品,用以減少實體圈選耗費的計算資源和存儲資源。
2、一方面,本申請實施例中提供了一種實體圈選的方法,方法包括:
3、根據業務數據,生成目標實體的標簽集合;標簽集合中包含至少一個實體標簽及其對應的標簽值;
4、從至少一個實體包各自對應的標簽條件中,篩選出標簽集合滿足的目標標簽條件;
5、根據目標標簽條件對應的實體包,獲得目標實體的實體包集合。
6、一種實施方式中,業務數據包括全量離線業務數據;根據業務數據,生成目標實體的標簽集合,包括:
7、接收周期性發送的全量離線業務數據;
8、根據接收的全量離線業務數據中包含的至少一個目標實體,生成目標實體集合;
9、根據全量離線業務數據,生成目標實體集合中至少一個目標實體各自對應的標簽集合。
10、一種實施方式中,
11、通過實時鏈路,對業務側進行監聽,實時獲取線上增量業務數據;
12、根據線上增量業務數據,更新至少一個目標實體各自對應的標簽集合。
13、一種實施方式中,根據線上增量業務數據,更新至少一個目標實體各自對應的標簽集合,包括:
14、分別針對線上增量業務數據的每一目標實體,執行以下步驟:
15、若目標實體集合中包含目標實體,則根據目標實體在全量離線業務數據以及線上增量業務數據中對應的數據,更新目標實體的標簽集合;
16、若目標實體集合中未包含目標實體,則根據目標實體在線上增量業務數據中對應的數據,生成目標實體的標簽集合,并將目標實體添加到目標實體集合中。
17、一種實施方式中,根據目標標簽條件對應的實體包,獲得目標實體的實體包集合,包括:
18、獲取至少一個實體包各自對應的實體包標識;
19、將目標標簽條件對應的實體包的實體包標識,添加到目標實體對應的實體包集合中。
20、一種實施方式中,目標實體為至少一個;在根據目標標簽條件對應的實體包,獲得目標實體的實體包集合之后,方法還包括:
21、根據接收的任務執行指令,獲得任務篩選條件;
22、從至少一個目標實體的實體包集合中,篩選出符合任務篩選條件的實體包集合;
23、根據實體包集合對應的目標實體,生成任務實體包;
24、根據任務實體包中的各目標實體,執行任務執行指令。
25、一種實施方式中,目標實體為至少一個;方法還包括:
26、將至少一個目標實體的實體包集合,發送至任務服務器,使得任務服務器根據任務執行指令,篩選出符合任務篩選條件的實體包集合對應的目標實體,獲得任務實體包,并根據任務實體包任務執行指令。
27、一方面,本申請實施例中提供了一種實體圈選的裝置,包括:
28、生成單元,用于根據業務數據,生成目標實體的標簽集合;標簽集合中包含至少一個實體標簽及其對應的標簽值;
29、篩選單元,用于從至少一個實體包各自對應的標簽條件中,篩選出標簽集合滿足的目標標簽條件;
30、獲得單元,用于根據目標標簽條件對應的實體包,獲得目標實體的實體包集合。
31、一種實施方式中,業務數據包括全量離線業務數據;生成單元用于:
32、接收周期性發送的全量離線業務數據;
33、根據接收的全量離線業務數據中包含的至少一個目標實體,生成目標實體集合;
34、根據全量離線業務數據,生成目標實體集合中至少一個目標實體各自對應的標簽集合。
35、一種實施方式中,業務數據還包括線上增量業務數據;生成單元用于:
36、通過實時鏈路,對業務側進行監聽,實時獲取線上增量業務數據;
37、根據線上增量業務數據,更新至少一個目標實體各自對應的標簽集合。
38、一種實施方式中,生成單元用于:
39、分別針對線上增量業務數據的每一目標實體,執行以下步驟:
40、若目標實體集合中包含目標實體,則根據目標實體在全量離線業務數據以及線上增量業務數據中對應的數據,更新目標實體的標簽集合;
41、若目標實體集合中未包含目標實體,則根據目標實體在線上增量業務數據中對應的數據,生成目標實體的標簽集合,并將目標實體添加到目標實體集合中。
42、一種實施方式中,獲得單元用于:
43、獲取至少一個實體包各自對應的實體包標識;
44、將目標標簽條件對應的實體包的實體包標識,添加到目標實體對應的實體包集合中。
45、一種實施方式中,目標實體為至少一個;獲得單元還用于:
46、根據接收的任務執行指令,獲得任務篩選條件;
47、從至少一個目標實體的實體包集合中,篩選出符合任務篩選條件的實體包集合;
48、根據實體包集合對應的目標實體,生成任務實體包;
49、根據任務實體包中的各目標實體,執行任務執行指令。
50、一種實施方式中,目標實體為至少一個;獲得單元還用于:
51、將至少一個目標實體的實體包集合,發送至任務服務器,使得任務服務器根據任務執行指令,篩選出符合任務篩選條件的實體包集合對應的目標實體,獲得任務實體包,并根據任務實體包任務執行指令。
52、一方面,本申請實施例中提供了一種電子設備,包括:
53、處理器;以及
54、存儲器,存儲有計算機指令,計算機指令用于使處理器執行如上述任一種實體圈選的各種可選實現方式中提供的方法的步驟。
55、一方面,本申請實施例中提供了一種計算機可讀存儲介質,存儲有計算機指令,計算機指令用于使計算機執行如上述任一種實體圈選的各種可選實現方式中提供的方法的步驟。
56、一方面,本申請實施例中提供了一種計算機程序產品,包括計算機可讀代碼,或者承載有計算機可讀代碼的非易失性計算機可讀存儲介質,當計算機可讀代碼在電子設備的處理器中運行時,電子設備中的處理器執行如上述任一種實體圈選的各種可選實現方式中提供的方法的步驟。
57、本申請實施例中的實體圈選的方法本文檔來自技高網...
【技術保護點】
1.一種實體圈選的方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述業務數據包括全量離線業務數據;所述根據業務數據,生成目標實體的標簽集合,包括:
3.根據權利要求2所述的方法,其特征在于,所述業務數據還包括線上增量業務數據;在根據所述全量離線業務數據,生成所述目標實體集合中至少一個目標實體各自對應的標簽集合之后,所述方法包括:
4.根據權利要求3所述的方法,其特征在于,所述根據所述線上增量業務數據,更新所述至少一個目標實體各自對應的標簽集合,包括:
5.根據權利要求1-4任一項所述的方法,其特征在于,所述根據所述目標標簽條件對應的實體包,獲得所述目標實體的實體包集合,包括:
6.根據權利要求1-4任一項所述的方法,其特征在于,所述目標實體為至少一個;在根據所述目標標簽條件對應的實體包,獲得所述目標實體的實體包集合之后,所述方法還包括:
7.根據權利要求1-4任一項所述的方法,其特征在于,所述目標實體為至少一個;所述方法還包括:
8.一種實體圈選的裝置,其特征在于,所
9.一種電子設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,存儲有計算機指令,所述計算機指令用于使計算機執行根據權利要求1至7任一項所述的方法。
11.一種計算機程序產品,其特征在于,包括計算機可讀代碼,或者承載有計算機可讀代碼的非易失性計算機可讀存儲介質,當所述計算機可讀代碼在電子設備的處理器中運行時,所述電子設備中的處理器根據權利要求1至7任一項所述的方法。
...【技術特征摘要】
1.一種實體圈選的方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述業務數據包括全量離線業務數據;所述根據業務數據,生成目標實體的標簽集合,包括:
3.根據權利要求2所述的方法,其特征在于,所述業務數據還包括線上增量業務數據;在根據所述全量離線業務數據,生成所述目標實體集合中至少一個目標實體各自對應的標簽集合之后,所述方法包括:
4.根據權利要求3所述的方法,其特征在于,所述根據所述線上增量業務數據,更新所述至少一個目標實體各自對應的標簽集合,包括:
5.根據權利要求1-4任一項所述的方法,其特征在于,所述根據所述目標標簽條件對應的實體包,獲得所述目標實體的實體包集合,包括:
6.根據權利要求1-4任一項所述的方法,...
【專利技術屬性】
技術研發人員:侯學博,
申請(專利權)人:行吟信息科技上海有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。