當(dāng)前位置: 首頁(yè) > 專(zhuān)利查詢>杭州城市大腦有限公司專(zhuān)利>正文

基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備技術(shù)方案

技術(shù)編號(hào)：44161937 閱讀：13 留言：0更新日期：2025-01-29 10:33

本發(fā)明專(zhuān)利技術(shù)提供一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備，該方法包括獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)以構(gòu)建初步任務(wù)集。將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)。將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)以生成符合微調(diào)指令格式的新任務(wù)集Task。將新任務(wù)集Task輸入通用Llama模型，基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集；計(jì)算每一新微調(diào)指令數(shù)據(jù)和相應(yīng)目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分并進(jìn)行篩選以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集。將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi)進(jìn)行精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

本專(zhuān)利技術(shù)涉及數(shù)據(jù)處理，且特別涉及一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備。

技術(shù)介紹

1、隨著深度學(xué)習(xí)技術(shù)的發(fā)展與成熟，自然語(yǔ)言大模型因其出色的語(yǔ)言處理能力以及創(chuàng)造力成為人工智能中的新星。雖然通用自然語(yǔ)言大模型技術(shù)在通用語(yǔ)言邏輯能力上的發(fā)展較為成熟出色，但其在專(zhuān)業(yè)垂直領(lǐng)域（如多任務(wù)的社會(huì)治理領(lǐng)域）上的應(yīng)用卻暴露出大量的問(wèn)題。

2、當(dāng)前，通用自然語(yǔ)言大模型在垂直領(lǐng)域上應(yīng)用存在的問(wèn)題主要有兩點(diǎn)。問(wèn)題一在于數(shù)據(jù)質(zhì)量較差。相對(duì)于通用領(lǐng)域的數(shù)據(jù)集，垂直領(lǐng)域的數(shù)據(jù)更需要業(yè)務(wù)領(lǐng)域的專(zhuān)家進(jìn)行審查，而如此將耗費(fèi)巨大的人力財(cái)力。而且普通的數(shù)據(jù)分析處理技術(shù)又達(dá)不到高數(shù)據(jù)質(zhì)量的要求，這樣會(huì)導(dǎo)致模型的能力更差甚至達(dá)不到通用模型原有的邏輯能力。問(wèn)題二則是專(zhuān)業(yè)領(lǐng)域的數(shù)據(jù)源較少，數(shù)據(jù)采集困難。如果只讓業(yè)務(wù)專(zhuān)家人工梳理產(chǎn)生不僅在速度上有著巨大限制，而且數(shù)據(jù)缺乏任務(wù)創(chuàng)造性，數(shù)據(jù)維度較單一的情況，還會(huì)導(dǎo)致數(shù)據(jù)質(zhì)量的變差。

技術(shù)實(shí)現(xiàn)思路

1、本專(zhuān)利技術(shù)為了克服現(xiàn)有技術(shù)的不足，提供一種借助第三方模型進(jìn)行數(shù)據(jù)擴(kuò)展任務(wù)數(shù)據(jù)集并對(duì)數(shù)據(jù)進(jìn)行評(píng)分篩選以獲得高質(zhì)量模型訓(xùn)練數(shù)據(jù)的基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備。

2、為了實(shí)現(xiàn)上述目的，本專(zhuān)利技術(shù)提供一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其包括：

3、獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)，并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集；

4、將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)，微

5、將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task，新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù)，為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集，表示第i個(gè)新微調(diào)指令數(shù)據(jù)，其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù)，對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽；

6、將新任務(wù)集task輸入通用llama模型，基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集；

7、計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分，并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù)，以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集；

8、將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi)，對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

9、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例，基于評(píng)分機(jī)制的大模型訓(xùn)練方法還包括：

10、在獲得精調(diào)指令數(shù)據(jù)集后，將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集；

11、基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練llama模型，以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

12、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例，初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù)，且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。

13、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例，在獲得初步任務(wù)集后：將初步任務(wù)集進(jìn)行分類(lèi)，根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集；

14、之后，再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集；

15、將兩類(lèi)新任務(wù)集分別輸入通用llama模型，以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。

16、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例，在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score時(shí)的步驟包括：

17、基于n-gram模型，計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的重合度指標(biāo)rouge-n和rouge-l，其中：

18、;

19、;

20、其中：和分別為句子的字符計(jì)數(shù)函數(shù)和字符的匹配數(shù)計(jì)數(shù)函數(shù)，為根據(jù)n-gram模型進(jìn)行字符拆分后的微調(diào)指令數(shù)據(jù)的字符序列，d為目標(biāo)領(lǐng)域數(shù)據(jù)集中的單個(gè)數(shù)據(jù)，為超參數(shù)要依據(jù)具體情況制定，為召回率，為精確率；

21、計(jì)算n-gram精度的幾何平均值并求出相應(yīng)權(quán)重；

22、令為候選翻譯的長(zhǎng)度且為有效參考語(yǔ)料庫(kù)長(zhǎng)度，以計(jì)算簡(jiǎn)潔懲罰bp和bleu指標(biāo)：

23、;

24、bleu=;

25、計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score：score=100(0.4rouge-n+0.4rouge-l+0.2bleu)。

26、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例，所獲取的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)包括方案數(shù)據(jù)、評(píng)價(jià)文章以及相關(guān)解讀數(shù)據(jù)。

27、另一方面，本專(zhuān)利技術(shù)還提供一種基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型，其采用上述基于評(píng)分機(jī)制的大模型訓(xùn)練方法訓(xùn)練后獲得。

28、另一方面，本專(zhuān)利技術(shù)還提供一種基于評(píng)分機(jī)制的數(shù)據(jù)模型訓(xùn)練系統(tǒng)，其包括：

29、數(shù)據(jù)獲取模塊，獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)，并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集；

30、微調(diào)模塊，將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)，微調(diào)指令格式包括任務(wù)主題類(lèi)型，待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽；

31、指令擴(kuò)展模塊，將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task，新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù)，為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集，表示第i個(gè)新微調(diào)指令數(shù)據(jù)，其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù)，對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽；

32、模型調(diào)用模塊，將新任務(wù)集task輸入通用llama模型，基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集；

33、精調(diào)指令篩選模塊，計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分，并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù)，以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集。

34、訓(xùn)練模塊，將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi)，對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

35、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例，在精調(diào)指令篩選模塊獲得精調(diào)指令數(shù)據(jù)集后，指令擴(kuò)展模塊將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集；之后，模型調(diào)用模塊將擴(kuò)展的精調(diào)指令數(shù)據(jù)集輸入訓(xùn)練llama模型，以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

36、另一方面，本專(zhuān)利技術(shù)還提供一種計(jì)算機(jī)設(shè)備，其包括存儲(chǔ)器和處理器，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述訓(xùn)練方法內(nèi)的步驟。

37、綜上所述，本專(zhuān)利技術(shù)提供的基于評(píng)分機(jī)制的大模型訓(xùn)練方法通過(guò)微調(diào)指令格式對(duì)初步任務(wù)集內(nèi)的每一數(shù)據(jù)進(jìn)行調(diào)整，以作為自監(jiān)督學(xué)習(xí)模型。通過(guò)自監(jiān)督學(xué)習(xí)模型按照微調(diào)指令數(shù)據(jù)的格式在每一任務(wù)本文檔來(lái)自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】

1.一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，包括：獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)，并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集；將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)，所述微調(diào)指令格式包括任務(wù)主題類(lèi)型，待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽；?將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集Task，新任務(wù)集Task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù)，為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集，表示第i個(gè)新微調(diào)指令數(shù)據(jù)，其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù)，對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽；將新任務(wù)集Task輸入通用Llama模型，基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集；計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分，并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù)，以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集；將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi)，對(duì)其精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

2.根據(jù)權(quán)利要求1所述

3.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，所述初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù)，且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。

4.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，在獲得初步任務(wù)集后：將初步任務(wù)集進(jìn)行分類(lèi)，根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集；之后，再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集；將兩類(lèi)新任務(wù)集分別輸入通用Llama模型，以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。

5.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分SCORE時(shí)的步驟包括：基于N-gram模型，計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的重合度指標(biāo)ROUGE-N和ROUGE-L，其中：

6.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，所獲取的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)包括方案數(shù)據(jù)、評(píng)價(jià)文章以及相關(guān)解讀數(shù)據(jù)。

7.一種基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型，其特征在于，采用權(quán)利要求1~6任一項(xiàng)所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法訓(xùn)練后獲得。

8.一種基于評(píng)分機(jī)制的大模型訓(xùn)練系統(tǒng)，其特征在于，包括：數(shù)據(jù)獲取模塊，獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)，并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集；微調(diào)模塊，將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)，所述微調(diào)指令格式包括任務(wù)主題類(lèi)型，待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽；指令擴(kuò)展模塊，將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集Task，新任務(wù)集Task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù)，為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集，表示第i個(gè)新微調(diào)指令數(shù)據(jù)，其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù)，對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽；模型調(diào)用模塊，將新任務(wù)集Task輸入通用Llama模型，基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集；精調(diào)指令篩選模塊，計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分，并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù)，以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集；訓(xùn)練模塊，將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi)，對(duì)其精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

9.根據(jù)權(quán)利要求9所述的基于評(píng)分機(jī)制的大模型訓(xùn)練系統(tǒng)，其特征在于，在精調(diào)指令篩選模塊獲得精調(diào)指令數(shù)據(jù)集后，指令擴(kuò)展模塊將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集；之后，模型調(diào)用模塊將擴(kuò)展的精調(diào)指令數(shù)據(jù)集輸入訓(xùn)練Llama模型，以獲得基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

10.一種計(jì)算機(jī)設(shè)備，其特征在于，包括存儲(chǔ)器和處理器，所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法內(nèi)的步驟。

...

【技術(shù)特征摘要】

1.一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，包括：獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)，并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集；將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)，所述微調(diào)指令格式包括任務(wù)主題類(lèi)型，待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽；?將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task，新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù)，為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集，表示第i個(gè)新微調(diào)指令數(shù)據(jù)，其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù)，對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽；將新任務(wù)集task輸入通用llama模型，基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集；計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分，并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù)，以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集；將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi)，對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

2.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，所述方法還包括：在獲得精調(diào)指令數(shù)據(jù)集后，將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集；基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練llama模型，以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

4.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，在獲得初步任務(wù)集后：將初步任務(wù)集進(jìn)行分類(lèi)，根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集；之后，再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)，基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集；將兩類(lèi)新任務(wù)集分別輸入通用llama模型，以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。

5.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法，其特征在于，在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score時(shí)...

【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員：申永生，洪永佳，趙鵬煒，葉曉華，韓萌，陳沖杰，
申請(qǐng)(專(zhuān)利權(quán))人：杭州城市大腦有限公司，
類(lèi)型：發(fā)明
國(guó)別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專(zhuān)利的主人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條評(píng)論

還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見(jiàn)

相關(guān)領(lǐng)域技術(shù)