System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及機(jī)器學(xué)習(xí),尤其涉及一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、大語言模型(large?languagemodel,簡(jiǎn)稱llm),后續(xù)簡(jiǎn)稱為“大模型”,是指在自然語言處理和機(jī)器學(xué)習(xí)領(lǐng)域中使用的具有龐大參數(shù)量和復(fù)雜結(jié)構(gòu)的深度學(xué)習(xí)模型,大模型目前在各領(lǐng)域得到廣泛應(yīng)用。
2、大模型擅長(zhǎng)于文本處理,但在直接解決具體任務(wù)時(shí)容易出現(xiàn)偏差。例如,大模型在電網(wǎng)主網(wǎng)操作任務(wù)執(zhí)行過程中,可能會(huì)出現(xiàn)理解或執(zhí)行錯(cuò)誤的情況。因此,如何提高大語言模型理解和執(zhí)行主網(wǎng)的操作任務(wù)指令,對(duì)于提高電網(wǎng)主網(wǎng)調(diào)度任務(wù)執(zhí)行的準(zhǔn)確性和執(zhí)行效率十分重要。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)提供了一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),以解決大模型在電網(wǎng)主網(wǎng)調(diào)度任務(wù)執(zhí)行準(zhǔn)確性低的問題。
2、根據(jù)本專利技術(shù)的一方面,提供了一種大模型適配方法,包括:
3、基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;
4、采用所述微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于所述輸出結(jié)果的反饋數(shù)據(jù);
5、基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。
6、根據(jù)本專利技術(shù)的另一方面,提供了一種大模型適配裝置,包括:
7、參數(shù)微調(diào)模塊,用于基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;
8、反饋獲取模塊,用于采用所述微調(diào)
9、強(qiáng)化學(xué)習(xí)模塊,用于基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。
10、根據(jù)本專利技術(shù)的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:
11、至少一個(gè)處理器;以及
12、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,
13、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本專利技術(shù)任一實(shí)施例所述的大模型適配方法。
14、根據(jù)本專利技術(shù)的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本專利技術(shù)任一實(shí)施例所述的大模型適配方法。
15、根據(jù)本專利技術(shù)的另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開任一實(shí)施例的大模型適配方法。
16、本專利技術(shù)實(shí)施例的技術(shù)方案,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,進(jìn)而采用微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于輸出結(jié)果的反饋數(shù)據(jù),最終基于輸出結(jié)果和反饋數(shù)據(jù),對(duì)微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,通過歷史主網(wǎng)操作指令數(shù)據(jù)對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),可以提高大模型對(duì)電網(wǎng)指令的理解能力,并且基于反饋數(shù)據(jù)進(jìn)一步強(qiáng)化學(xué)習(xí),可以是的大模型輸出更符合實(shí)際業(yè)務(wù)需求。
17、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本專利技術(shù)的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本專利技術(shù)的范圍。本專利技術(shù)的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種大模型適配方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述損失函數(shù)具體如下:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獎(jiǎng)勵(lì)函數(shù)具體如下:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,基于損失函數(shù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型之后,還包括:
8.一種大模型適配裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中
...【技術(shù)特征摘要】
1.一種大模型適配方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述損失函數(shù)具體如下:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獎(jiǎng)勵(lì)函數(shù)具體如下:
6.根據(jù)權(quán)利...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:賴偉堅(jiān),邱澤堅(jiān),司徒友,羅松林,蔡新雷,劉樹安,李敬光,汪杰,李敬航,郝乾嘯,
申請(qǐng)(專利權(quán))人:廣東電網(wǎng)有限責(zé)任公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。