System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 免费a级毛片无码a∨免费软件,国产激情无码视频在线播放性色,久久久无码精品亚洲日韩京东传媒
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)制造方法及圖紙

    技術(shù)編號(hào):44529365 閱讀:1 留言:0更新日期:2025-03-07 13:19
    本發(fā)明專利技術(shù)公開了一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。第大模型適配方法,包括:基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;采用微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于輸出結(jié)果的反饋數(shù)據(jù);基于輸出結(jié)果和反饋數(shù)據(jù),對(duì)微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。本發(fā)明專利技術(shù)實(shí)施例的技術(shù)方案,可以提高大模型對(duì)電網(wǎng)指令的理解能力。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及機(jī)器學(xué)習(xí),尤其涉及一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)


    技術(shù)介紹

    1、大語言模型(large?languagemodel,簡(jiǎn)稱llm),后續(xù)簡(jiǎn)稱為“大模型”,是指在自然語言處理和機(jī)器學(xué)習(xí)領(lǐng)域中使用的具有龐大參數(shù)量和復(fù)雜結(jié)構(gòu)的深度學(xué)習(xí)模型,大模型目前在各領(lǐng)域得到廣泛應(yīng)用。

    2、大模型擅長(zhǎng)于文本處理,但在直接解決具體任務(wù)時(shí)容易出現(xiàn)偏差。例如,大模型在電網(wǎng)主網(wǎng)操作任務(wù)執(zhí)行過程中,可能會(huì)出現(xiàn)理解或執(zhí)行錯(cuò)誤的情況。因此,如何提高大語言模型理解和執(zhí)行主網(wǎng)的操作任務(wù)指令,對(duì)于提高電網(wǎng)主網(wǎng)調(diào)度任務(wù)執(zhí)行的準(zhǔn)確性和執(zhí)行效率十分重要。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)提供了一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),以解決大模型在電網(wǎng)主網(wǎng)調(diào)度任務(wù)執(zhí)行準(zhǔn)確性低的問題。

    2、根據(jù)本專利技術(shù)的一方面,提供了一種大模型適配方法,包括:

    3、基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;

    4、采用所述微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于所述輸出結(jié)果的反饋數(shù)據(jù);

    5、基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。

    6、根據(jù)本專利技術(shù)的另一方面,提供了一種大模型適配裝置,包括:

    7、參數(shù)微調(diào)模塊,用于基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;

    8、反饋獲取模塊,用于采用所述微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于所述輸出結(jié)果的反饋數(shù)據(jù);

    9、強(qiáng)化學(xué)習(xí)模塊,用于基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。

    10、根據(jù)本專利技術(shù)的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:

    11、至少一個(gè)處理器;以及

    12、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,

    13、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本專利技術(shù)任一實(shí)施例所述的大模型適配方法。

    14、根據(jù)本專利技術(shù)的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本專利技術(shù)任一實(shí)施例所述的大模型適配方法。

    15、根據(jù)本專利技術(shù)的另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開任一實(shí)施例的大模型適配方法。

    16、本專利技術(shù)實(shí)施例的技術(shù)方案,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,進(jìn)而采用微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于輸出結(jié)果的反饋數(shù)據(jù),最終基于輸出結(jié)果和反饋數(shù)據(jù),對(duì)微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,通過歷史主網(wǎng)操作指令數(shù)據(jù)對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),可以提高大模型對(duì)電網(wǎng)指令的理解能力,并且基于反饋數(shù)據(jù)進(jìn)一步強(qiáng)化學(xué)習(xí),可以是的大模型輸出更符合實(shí)際業(yè)務(wù)需求。

    17、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本專利技術(shù)的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本專利技術(shù)的范圍。本專利技術(shù)的其它特征將通過以下的說明書而變得容易理解。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種大模型適配方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述損失函數(shù)具體如下:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獎(jiǎng)勵(lì)函數(shù)具體如下:

    6.根據(jù)權(quán)利要求2所述的方法,其特征在于,基于損失函數(shù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:

    7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型之后,還包括:

    8.一種大模型適配裝置,其特征在于,包括:

    9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:

    10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的大模型適配方法。

    ...

    【技術(shù)特征摘要】

    1.一種大模型適配方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述損失函數(shù)具體如下:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獎(jiǎng)勵(lì)函數(shù)具體如下:

    6.根據(jù)權(quán)利...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:賴偉堅(jiān)邱澤堅(jiān)司徒友羅松林蔡新雷劉樹安李敬光汪杰李敬航郝乾嘯
    申請(qǐng)(專利權(quán))人:廣東電網(wǎng)有限責(zé)任公司
    類型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 波多野结AV衣东京热无码专区| 亚洲无码一区二区三区| 在线精品自拍无码| 日韩av无码免费播放| 久久久无码精品亚洲日韩京东传媒 | 久久国产精品无码一区二区三区 | 无码av天天av天天爽| 中文字幕人妻无码专区| 国产品无码一区二区三区在线| 亚洲精品无码久久千人斩| 无码人妻精品丰满熟妇区| 日韩一区二区三区无码影院| 久久综合一区二区无码| 亚洲av无码日韩av无码网站冲| 无码精品日韩中文字幕| 亚洲国产av无码精品| 国产成人无码网站| 无码国模国产在线观看免费 | 日本无码一区二区三区白峰美| 亚洲va无码手机在线电影| 亚洲人成人无码网www国产| 亚洲av无码无线在线观看| 一本色道久久综合无码人妻| 秋霞鲁丝片Av无码少妇| 亚洲日产无码中文字幕| 国模无码一区二区三区不卡| 久久久久亚洲AV无码专区网站| 日产无码1区2区在线观看| 日韩精品无码区免费专区| 人妻少妇精品无码专区| 小12箩利洗澡无码视频网站| 久久亚洲AV成人无码国产最大| 无码中文人妻在线一区二区三区| 亚洲中文字幕无码av在线| av大片在线无码免费| 亚洲国产精品无码久久九九大片| 亚洲av无码专区在线观看亚| 久久人妻无码一区二区| 无码人妻一区二区三区免费视频 | 国产精品热久久无码av| 精选观看中文字幕高清无码|