System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及數(shù)據(jù)處理,且特別涉及一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備。
技術(shù)介紹
1、隨著深度學(xué)習(xí)技術(shù)的發(fā)展與成熟,自然語(yǔ)言大模型因其出色的語(yǔ)言處理能力以及創(chuàng)造力成為人工智能中的新星。雖然通用自然語(yǔ)言大模型技術(shù)在通用語(yǔ)言邏輯能力上的發(fā)展較為成熟出色,但其在專(zhuān)業(yè)垂直領(lǐng)域(如多任務(wù)的社會(huì)治理領(lǐng)域)上的應(yīng)用卻暴露出大量的問(wèn)題。
2、當(dāng)前,通用自然語(yǔ)言大模型在垂直領(lǐng)域上應(yīng)用存在的問(wèn)題主要有兩點(diǎn)。問(wèn)題一在于數(shù)據(jù)質(zhì)量較差。相對(duì)于通用領(lǐng)域的數(shù)據(jù)集,垂直領(lǐng)域的數(shù)據(jù)更需要業(yè)務(wù)領(lǐng)域的專(zhuān)家進(jìn)行審查,而如此將耗費(fèi)巨大的人力財(cái)力。而且普通的數(shù)據(jù)分析處理技術(shù)又達(dá)不到高數(shù)據(jù)質(zhì)量的要求,這樣會(huì)導(dǎo)致模型的能力更差甚至達(dá)不到通用模型原有的邏輯能力。問(wèn)題二則是專(zhuān)業(yè)領(lǐng)域的數(shù)據(jù)源較少,數(shù)據(jù)采集困難。如果只讓業(yè)務(wù)專(zhuān)家人工梳理產(chǎn)生不僅在速度上有著巨大限制,而且數(shù)據(jù)缺乏任務(wù)創(chuàng)造性,數(shù)據(jù)維度較單一的情況,還會(huì)導(dǎo)致數(shù)據(jù)質(zhì)量的變差。
技術(shù)實(shí)現(xiàn)思路
1、本專(zhuān)利技術(shù)為了克服現(xiàn)有技術(shù)的不足,提供一種借助第三方模型進(jìn)行數(shù)據(jù)擴(kuò)展任務(wù)數(shù)據(jù)集并對(duì)數(shù)據(jù)進(jìn)行評(píng)分篩選以獲得高質(zhì)量模型訓(xùn)練數(shù)據(jù)的基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備。
2、為了實(shí)現(xiàn)上述目的,本專(zhuān)利技術(shù)提供一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其包括:
3、獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;
4、將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),微
5、將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task,新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;
6、將新任務(wù)集task輸入通用llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;
7、計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;
8、將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
9、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,基于評(píng)分機(jī)制的大模型訓(xùn)練方法還包括:
10、在獲得精調(diào)指令數(shù)據(jù)集后,將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;
11、基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練llama模型,以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
12、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù),且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。
13、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,在獲得初步任務(wù)集后:將初步任務(wù)集進(jìn)行分類(lèi),根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集;
14、之后,再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集;
15、將兩類(lèi)新任務(wù)集分別輸入通用llama模型,以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。
16、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score時(shí)的步驟包括:
17、基于n-gram模型,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的重合度指標(biāo)rouge-n和rouge-l,其中:
18、;
19、;
20、其中:和分別為句子的字符計(jì)數(shù)函數(shù)和字符的匹配數(shù)計(jì)數(shù)函數(shù),為根據(jù)n-gram模型進(jìn)行字符拆分后的微調(diào)指令數(shù)據(jù)的字符序列,d為目標(biāo)領(lǐng)域數(shù)據(jù)集中的單個(gè)數(shù)據(jù),為超參數(shù)要依據(jù)具體情況制定,為召回率,為精確率;
21、計(jì)算n-gram精度的幾何平均值并求出相應(yīng)權(quán)重;
22、令為候選翻譯的長(zhǎng)度且為有效參考語(yǔ)料庫(kù)長(zhǎng)度,以計(jì)算簡(jiǎn)潔懲罰bp和bleu指標(biāo):
23、;
24、bleu=;
25、計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score:score=100(0.4rouge-n+0.4rouge-l+0.2bleu)。
26、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,所獲取的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)包括方案數(shù)據(jù)、評(píng)價(jià)文章以及相關(guān)解讀數(shù)據(jù)。
27、另一方面,本專(zhuān)利技術(shù)還提供一種基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型,其采用上述基于評(píng)分機(jī)制的大模型訓(xùn)練方法訓(xùn)練后獲得。
28、另一方面,本專(zhuān)利技術(shù)還提供一種基于評(píng)分機(jī)制的數(shù)據(jù)模型訓(xùn)練系統(tǒng),其包括:
29、數(shù)據(jù)獲取模塊,獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;
30、微調(diào)模塊,將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;
31、指令擴(kuò)展模塊,將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task,新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;
32、模型調(diào)用模塊,將新任務(wù)集task輸入通用llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;
33、精調(diào)指令篩選模塊,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集。
34、訓(xùn)練模塊,將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
35、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,在精調(diào)指令篩選模塊獲得精調(diào)指令數(shù)據(jù)集后,指令擴(kuò)展模塊將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;之后,模型調(diào)用模塊將擴(kuò)展的精調(diào)指令數(shù)據(jù)集輸入訓(xùn)練llama模型,以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
36、另一方面,本專(zhuān)利技術(shù)還提供一種計(jì)算機(jī)設(shè)備,其包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述訓(xùn)練方法內(nèi)的步驟。
37、綜上所述,本專(zhuān)利技術(shù)提供的基于評(píng)分機(jī)制的大模型訓(xùn)練方法通過(guò)微調(diào)指令格式對(duì)初步任務(wù)集內(nèi)的每一數(shù)據(jù)進(jìn)行調(diào)整,以作為自監(jiān)督學(xué)習(xí)模型。通過(guò)自監(jiān)督學(xué)習(xí)模型按照微調(diào)指令數(shù)據(jù)的格式在每一任務(wù)本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,包括:獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),所述微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;?將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集Task,新任務(wù)集Task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;將新任務(wù)集Task輸入通用Llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
2.根據(jù)權(quán)利要求1所述
3.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù),且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在獲得初步任務(wù)集后:將初步任務(wù)集進(jìn)行分類(lèi),根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集;之后,再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集;將兩類(lèi)新任務(wù)集分別輸入通用Llama模型,以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。
5.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分SCORE時(shí)的步驟包括:基于N-gram模型,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的重合度指標(biāo)ROUGE-N和ROUGE-L,其中:
6.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所獲取的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)包括方案數(shù)據(jù)、評(píng)價(jià)文章以及相關(guān)解讀數(shù)據(jù)。
7.一種基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型,其特征在于,采用權(quán)利要求1~6任一項(xiàng)所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法訓(xùn)練后獲得。
8.一種基于評(píng)分機(jī)制的大模型訓(xùn)練系統(tǒng),其特征在于,包括:數(shù)據(jù)獲取模塊,獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;微調(diào)模塊,將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),所述微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;指令擴(kuò)展模塊,將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集Task,新任務(wù)集Task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;模型調(diào)用模塊,將新任務(wù)集Task輸入通用Llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;精調(diào)指令篩選模塊,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;訓(xùn)練模塊,將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
9.根據(jù)權(quán)利要求9所述的基于評(píng)分機(jī)制的大模型訓(xùn)練系統(tǒng),其特征在于,在精調(diào)指令篩選模塊獲得精調(diào)指令數(shù)據(jù)集后,指令擴(kuò)展模塊將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;之后,模型調(diào)用模塊將擴(kuò)展的精調(diào)指令數(shù)據(jù)集輸入訓(xùn)練Llama模型,以獲得基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
10.一種計(jì)算機(jī)設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法內(nèi)的步驟。
...【技術(shù)特征摘要】
1.一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,包括:獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),所述微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;?將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task,新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;將新任務(wù)集task輸入通用llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
2.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述方法還包括:在獲得精調(diào)指令數(shù)據(jù)集后,將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練llama模型,以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。
3.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù),且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在獲得初步任務(wù)集后:將初步任務(wù)集進(jìn)行分類(lèi),根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集;之后,再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集;將兩類(lèi)新任務(wù)集分別輸入通用llama模型,以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。
5.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score時(shí)...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:申永生,洪永佳,趙鵬煒,葉曉華,韓萌,陳沖杰,
申請(qǐng)(專(zhuān)利權(quán))人:杭州城市大腦有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。