System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及人工智能(artificial?intelligence,ai),尤其涉及一種數(shù)據(jù)處理方法、裝置、芯片、計(jì)算設(shè)備、計(jì)算設(shè)備集群、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。
技術(shù)介紹
1、隨著ai技術(shù)的不斷發(fā)展,越來(lái)越多的行業(yè)和領(lǐng)域采用ai模型(為了便于描述,有些情況下也簡(jiǎn)稱為模型)實(shí)現(xiàn)業(yè)務(wù)的智能化、自動(dòng)化。例如,電子商務(wù)行業(yè)中,電商平臺(tái)通過訓(xùn)練ai模型,向用戶推薦感興趣的物品。又例如,在社交領(lǐng)域,社交平臺(tái)通過訓(xùn)練ai模型,向用戶推薦感興趣的圖文,實(shí)現(xiàn)個(gè)性化推薦。
2、ai模型是指基于ai技術(shù)構(gòu)建的、用于對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)的數(shù)學(xué)模型。ai模型的一個(gè)典型應(yīng)用是推薦模型,包括但不限于物品推薦模型、視頻推薦模型、文本推薦模型、圖像推薦模型。上述ai模型可以由數(shù)據(jù)驅(qū)動(dòng),通常需要通過大量數(shù)據(jù)(例如是樣本數(shù)據(jù))進(jìn)行訓(xùn)練。
3、以推薦模型為代表的ai模型的樣本數(shù)據(jù)規(guī)模通常可以達(dá)到幾十太字節(jié)(terabyte,tb),甚至是幾百tb。在訓(xùn)練上述ai模型時(shí),通常會(huì)使用大規(guī)模的稀疏特征,包括物品標(biāo)識(shí)(identifier,id)、用戶id等id類特征。為此,通常需要將上述稀疏特征進(jìn)行向量映射,例如通過嵌入(embedding)方式將其映射為稠密向量,并存儲(chǔ)在稀疏表中,以便于使用深度學(xué)習(xí)框架進(jìn)行訓(xùn)練。具體實(shí)現(xiàn)時(shí),ai模型的業(yè)務(wù)腳本可以指定創(chuàng)建的稀疏表的參數(shù),然后稀疏表初始化時(shí)可以按照上述參數(shù)初始化。
4、然而,更換數(shù)據(jù)集時(shí),上述方案需要調(diào)整初始化稀疏表的參數(shù),泛化性較差,訓(xùn)練效率比較低下,難以滿足業(yè)務(wù)需求。
...【技術(shù)保護(hù)點(diǎn)】
1.一種數(shù)據(jù)處理方法,其特征在于,應(yīng)用于計(jì)算設(shè)備中主機(jī)側(cè)的第一芯片,所述第一芯片用于基于人工智能AI模型的業(yè)務(wù)腳本,使用數(shù)據(jù)集中的稀疏特征訓(xùn)練所述AI模型,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述調(diào)用內(nèi)存分配接口以申請(qǐng)內(nèi)存塊,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述當(dāng)所述第一內(nèi)存塊的剩余容量滿足設(shè)定條件,發(fā)送所述內(nèi)存分配接口的第二調(diào)用請(qǐng)求,包括:
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述稀疏表初始化請(qǐng)求中不包括所述稀疏表的容量。
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述內(nèi)存塊還用于存儲(chǔ)優(yōu)化器的參數(shù),所述查詢請(qǐng)求還用于查詢所述優(yōu)化器的參數(shù);
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的方法,其特征在于,所述計(jì)算設(shè)備的設(shè)備側(cè)包括第二芯片,所述調(diào)用內(nèi)存分配接口以申請(qǐng)內(nèi)存塊,包括:
9.一種數(shù)據(jù)處理裝置,其特
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述接口調(diào)用模塊具體用于:
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述接口調(diào)用模塊具體用于:
12.根據(jù)權(quán)利要求9至11任一項(xiàng)所述的裝置,其特征在于,所述通信模塊還用于:
13.根據(jù)權(quán)利要求9至12任一項(xiàng)所述的裝置,其特征在于,所述稀疏表初始化請(qǐng)求中不包括所述稀疏表的容量。
14.根據(jù)權(quán)利要求9至13任一項(xiàng)所述的裝置,其特征在于,所述通信模塊還用于:
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,所述內(nèi)存塊還用于存儲(chǔ)優(yōu)化器的參數(shù),所述查詢請(qǐng)求還用于查詢所述優(yōu)化器的參數(shù);
16.根據(jù)權(quán)利要求9至15任一項(xiàng)所述的裝置,其特征在于,所述計(jì)算設(shè)備的設(shè)備側(cè)包括第二芯片,所述接口調(diào)用模塊具體用于:
17.一種芯片,其特征在于,所述芯片包括處理器和通信接口,所述通信接口用于接收計(jì)算機(jī)可讀指令,所述處理器用于執(zhí)行所述計(jì)算機(jī)可讀指令,從而執(zhí)行如權(quán)利要求1至8任一項(xiàng)所述的方法。
18.一種計(jì)算設(shè)備,其特征在于,所述計(jì)算設(shè)備包括主機(jī)側(cè)的第一芯片和設(shè)備側(cè)的第二芯片,所述第一芯片用于執(zhí)行如權(quán)利要求1至8任一項(xiàng)所述的方法。
19.一種計(jì)算設(shè)備集群,其特征在于,所述計(jì)算設(shè)備集群包括至少一臺(tái)計(jì)算設(shè)備,所述至少一臺(tái)計(jì)算設(shè)備包括主機(jī)側(cè)的第一芯片和設(shè)備側(cè)的第二芯片,所述第一芯片用于執(zhí)行如權(quán)利要求1至8任一項(xiàng)所述的方法。
20.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,包括計(jì)算機(jī)可讀指令;所述計(jì)算機(jī)可讀指令用于實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的方法。
21.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)可讀指令;所述計(jì)算機(jī)可讀指令用于實(shí)現(xiàn)權(quán)利要求1至8任一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種數(shù)據(jù)處理方法,其特征在于,應(yīng)用于計(jì)算設(shè)備中主機(jī)側(cè)的第一芯片,所述第一芯片用于基于人工智能ai模型的業(yè)務(wù)腳本,使用數(shù)據(jù)集中的稀疏特征訓(xùn)練所述ai模型,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述調(diào)用內(nèi)存分配接口以申請(qǐng)內(nèi)存塊,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述當(dāng)所述第一內(nèi)存塊的剩余容量滿足設(shè)定條件,發(fā)送所述內(nèi)存分配接口的第二調(diào)用請(qǐng)求,包括:
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述稀疏表初始化請(qǐng)求中不包括所述稀疏表的容量。
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述內(nèi)存塊還用于存儲(chǔ)優(yōu)化器的參數(shù),所述查詢請(qǐng)求還用于查詢所述優(yōu)化器的參數(shù);
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的方法,其特征在于,所述計(jì)算設(shè)備的設(shè)備側(cè)包括第二芯片,所述調(diào)用內(nèi)存分配接口以申請(qǐng)內(nèi)存塊,包括:
9.一種數(shù)據(jù)處理裝置,其特征在于,所述裝置部署于計(jì)算設(shè)備中主機(jī)側(cè)的第一芯片,所述第一芯片用于基于人工智能ai模型的業(yè)務(wù)腳本,使用數(shù)據(jù)集中的稀疏特征訓(xùn)練所述ai模型,所述裝置包括:
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述接口調(diào)用模塊具體用于:
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述接口調(diào)用模塊具體用于:
12.根據(jù)權(quán)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:郝日佩,黃鑫,
申請(qǐng)(專利權(quán))人:成都華為技術(shù)有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。