System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 五十路熟妇高熟无码视频,亚洲国产精品无码久久九九 ,久青草无码视频在线观看
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    圖像生成模型的訓練、圖像生成方法、裝置、設備和介質制造方法及圖紙

    技術編號:44474617 閱讀:3 留言:0更新日期:2025-03-04 17:44
    本公開實施例提供一種圖像生成模型的訓練、圖像生成方法、裝置、設備和介質,該方法包括:獲取第一圖像描述及其對應的第一樣本圖像;利用第一圖像描述,通過第一圖像生成模型,得到第一生成圖像;利用第一生成圖像和第一圖像描述,通過目標獎勵模型,得到預測權重值,預測權重值與第一生成圖像的圖像質量正相關,和/或,與第一圖像描述和第一生成圖像之間的匹配度正相關;基于第一生成圖像與第一樣本圖像之間的差異以及預測權重值,調整第一圖像生成模型的參數。

    【技術實現步驟摘要】

    本公開涉及計算,尤其涉及一種圖像生成模型的訓練、圖像生成方法、裝置、設備和介質


    技術介紹

    1、圖像生成領域中,一般可以利用圖像描述(也可以稱為文本提示即prompt)來指導圖像的生成。具體的,根據圖像描述,通過基于內容生成技術的圖像生成模型,得到前述圖像描述相應的圖像。

    2、在上述過程中,為了保證所生成圖像的質量,需要所利用的圖像生成模型具有更好的圖像生成能力,那么,如何提供一種訓練得到具有更好的圖像生成能力的圖像生成模型成為亟待解決的問題。


    技術實現思路

    1、本公開一個或多個實施例提供了一種圖像生成模型的訓練方法、裝置、設備和介質、以及圖像生成方法、裝置、設備和介質,以實現訓練得到具有更好的圖像生成能力的圖像生成模型。

    2、根據第一方面,提供一種圖像生成模型的訓練方法,包括:

    3、獲取第一圖像描述及其對應的第一樣本圖像;

    4、利用所述第一圖像描述,通過第一圖像生成模型,得到第一生成圖像;

    5、利用所述第一生成圖像和所述第一圖像描述,通過目標獎勵模型,得到預測權重值,所述預測權重值與所述第一生成圖像的圖像質量正相關,和/或,與所述第一圖像描述和所述第一生成圖像之間的匹配度正相關;

    6、基于所述第一生成圖像與所述第一樣本圖像之間的差異以及所述預測權重值,調整所述第一圖像生成模型的參數。

    7、在一種可選實施方式中,所述調整所述第一圖像生成模型的參數,包括:利用預設損失函數,根據所述第一生成圖像與所述第一樣本圖像之間的差異,確定中間預測損失;基于所述中間預測損失與所述預測權重值的乘積,確定第一預測損失;以最小化所述第一預測損失為目標,調整所述第一圖像生成模型的參數。本實施方式中,基于中間預測損失與預測權重值的乘積確定第一預測損失,可以使得在訓練第一圖像生成模型的過程中,更側重利用所對應預測權重值更高的圖文對來確定第一預測損失,即更側重利用質量好的圖文對來訓練第一圖像生成模型,以實現更好的提高第一圖像生成模型的圖像生成能力,保證其圖像生成能力的穩定性。

    8、在一種可選實施方式中,還包括:利用第一圖像描述輸,通過預訓練過的第二圖像生成模型,得到第二生成圖像;所述調整所述第一圖像生成模型的參數,包括:基于所述第一生成圖像與所述第一樣本圖像之間的差異、所述預測權重值以及所述第一生成圖像與所述第二生成圖像之間的差異,調整所述第一圖像生成模型的所述參數。本實施方式中,結合第一生成圖像與第二圖像生成模型所生成的第二生成圖像之間的差異,來調整第一圖像生成模型的參數,可以實現在提高第一圖像生成模型的圖像生成能力的同時,避免第一圖像生成模型所生成的圖像偏離第二圖像生成模型所生成的圖像過多,以避免出現第一圖像生成模型生成混亂的圖像(與所輸入的圖像描述不匹配的圖像)來欺騙目標獎勵模型,致使目標獎勵模型對第一圖像生成模型生成混亂的圖像輸出數值較高的預測權重值的情況的發生。

    9、在一種可選實施方式中,所述調整所述第一圖像生成模型的所述參數,包括:基于所述第一生成圖像與所述第二生成圖像之間的差異,確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值;基于所述第一生成圖像與所述第一樣本圖像之間的差異、所述預測權重值以及所述圖像差異值,確定第一預測損失;以最小化所述第一預測損失為目標,調整所述第一圖像生成模型的參數本實施方式中,利用第一生成圖像和第二生成圖像之間的圖像差異值,來懲罰第一圖像生成模型所生成的圖像偏離第二圖像生成模型所生成的圖像太遠的情況,其中,圖像差異值越大懲罰越大,以避免出現第一圖像生成模型生成混亂的圖像來欺騙目標獎勵模型,致使目標獎勵模型對第一圖像生成模型生成混亂的圖像輸出數值較高的預測權重值的情況的發生。

    10、在一種可選實施方式中,所述確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值,包括:利用預設散度算法,基于所述第一生成圖像和所述第二生成圖像之間的差異,確定散度值;基于所述散度值,確定所述圖像差異值。本實施方式中,利用預設散度算法,可以更準確地確定出第一生成圖像和第二生成圖像之間的圖像差異,進而可以更好的避免出現第一圖像生成模型生成混亂的圖像來欺騙目標獎勵模型,致使目標獎勵模型對第一圖像生成模型生成混亂的圖像輸出數值較高的預測權重值的情況的發生。

    11、在一種可選實施方式中,所述第一樣本圖像為利用所述第二圖像生成模型,根據所述第一圖像描述而生成的圖像。本實施方式中,利用第二圖像生成模型,根據第一圖像描述而生成的圖像及相應的第一圖像描述所構成的圖文對的質量相對更好,利用該類圖文對訓練第一圖像生成模型,有助于訓練得到可以生成質量更好的圖像的第一圖像生成模型。

    12、在一種可選實施方式中,還包括:獲取第二圖像描述及其對應的第二樣本圖像;利用所述第二圖像描述,通過所述第一圖像生成模型,得到第三生成圖像;利用所述第二樣本圖像與所述第三生成圖像之間的差異,確定第二預測損失;所述以最小化所述第一預測損失為目標,調整所述第一圖像生成模型的參數,包括:以最小化所述第一預測損失和所述第二預測損失為目標,調整所述第一圖像生成模型的參數。本實施方式中,在訓練第一圖像生成模型的過程中,還增加真實圖像及其對應的圖像描述對第一圖像生成模型進行訓練,增加了訓練第一圖像生成模型的數據的多樣性,更好的提高了第一圖像生成模型的圖像生成能力。

    13、在一種可選實施方式中,還包括:獲取所述第三圖像描述以及所述第三樣本圖像;獲取與所述第三圖像描述及所述第三樣本圖像相對應的所述標簽權重值,所述標簽權重值與所述第三樣本圖像的圖像質量正相關,和/或,與所述第三圖像描述以及所述第三樣本圖像之間的匹配度正相關;利用所述第三圖像描述及所述第三樣本圖像,通過待訓練的獎勵模型,得到評估權重值;利用所述評估權重值和所述標簽權重值,確定第三預測損失;以最小化所述第三預測損失為目標,調整所述待訓練的獎勵模型,以得到達到第一收斂條件的目標獎勵模型。本實施方式中,利用第三圖像描述及第三樣本圖像,以及與其兩者相對應的標簽權重值,訓練待訓練的獎勵模型,以得到達到第一收斂條件的目標獎勵模型,可以實現對待訓練的獎勵模型的確定結果的監督訓練,保持其準確性,提高了待訓練的獎勵模型的確定結果的準確性。

    14、在一種可選實施方式中,所述標簽權重值基于如下至少一個信息確定:所述第三樣本圖像的清晰度分值、所述第三樣本圖像的美學分值以及所述第三樣本圖像與所述第三圖像描述之間的匹配度值。本實施方式中,通過若干可以表征圖像的質量和/或圖像及其圖像描述的質量和匹配度的信息,來確定標簽權重值,在一定程度上,可以使得該標簽權重值可以更好的表征出人類對相應圖像及其圖像描述的質量評價,進而提高目標獎勵模型所輸出的預測權重值的準確性,使得預測權重值更適配人類反饋。

    15、根據第二方面,提供一種圖像生成方法,包括:

    16、獲取待處理圖像描述;

    17、利用所述待處理圖像描述,通過利用第一方面所述的圖像生成模型的訓練方法訓練本文檔來自技高網...

    【技術保護點】

    1.一種圖像生成模型的訓練方法,包括:

    2.如權利要求1所述的方法,其中,所述調整所述第一圖像生成模型的參數,包括:

    3.如權利要求1所述的方法,還包括:

    4.如權利要求3所述的方法,其中,所述調整所述第一圖像生成模型的所述參數,包括:

    5.如權利要求4所述的方法,其中,所述確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值,包括:

    6.如權利要求3所述的方法,其中,所述第一樣本圖像為利用所述第二圖像生成模型,根據所述第一圖像描述而生成的圖像。

    7.如權利要求2所述的方法,還包括:

    8.如權利要求1-7任一項所述的方法,還包括:

    9.如權利要求1-7任一項所述的方法,其中,所述標簽權重值基于如下至少一個信息確定:所述第三樣本圖像的清晰度分值、所述第三樣本圖像的美學分值以及所述第三樣本圖像與所述第三圖像描述之間的匹配度值。

    10.一種圖像生成方法,包括:

    11.一種圖像生成模型的訓練裝置,包括:

    12.一種圖像生成裝置,包括:

    13.一種電子設備,包括存儲器和處理器,其中,所述存儲器中存儲有可執行代碼,所述處理器執行所述可執行代碼時,實現權利要求1-10中任一項所述的方法。

    14.一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序在計算機中執行時,令計算機執行權利要求1-10中任一項所述的方法。

    ...

    【技術特征摘要】

    1.一種圖像生成模型的訓練方法,包括:

    2.如權利要求1所述的方法,其中,所述調整所述第一圖像生成模型的參數,包括:

    3.如權利要求1所述的方法,還包括:

    4.如權利要求3所述的方法,其中,所述調整所述第一圖像生成模型的所述參數,包括:

    5.如權利要求4所述的方法,其中,所述確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值,包括:

    6.如權利要求3所述的方法,其中,所述第一樣本圖像為利用所述第二圖像生成模型,根據所述第一圖像描述而生成的圖像。

    7.如權利要求2所述的方法,還包括:

    8.如權利要求1-7任一項所述的方法,還包括:

    9.如...

    【專利技術屬性】
    技術研發人員:吳捷
    申請(專利權)人:北京字跳網絡技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲日韩乱码中文无码蜜桃| 精品无码一区二区三区电影| 人妻无码一区二区三区| 无码人妻精品一区二区蜜桃AV| 国产精品亚洲一区二区无码| 亚洲一区爱区精品无码| 无码夜色一区二区三区| 亚洲AV无码精品色午夜在线观看| 东京热加勒比无码视频| 亚洲的天堂av无码| 亚洲人成无码网站| 国产精品毛片无码| 性色av极品无码专区亚洲| 亚洲AV无码成人精品区蜜桃| 亚洲成a人无码亚洲成av无码| 久久老子午夜精品无码| 暴力强奷在线播放无码| 人妻丰满熟妇A v无码区不卡| 亚洲av成本人无码网站| 亚洲av午夜精品无码专区| 亚洲乱亚洲乱妇无码麻豆| 丰满少妇人妻无码| 亚欧无码精品无码有性视频| 无码人妻精品丰满熟妇区| 中文字幕无码乱码人妻系列蜜桃| 人妻丰满熟妇av无码区不卡| 久久久久无码国产精品不卡| 国产精品白浆无码流出| 久久久久亚洲精品无码网址色欲 | 人禽无码视频在线观看| 亚洲自偷自偷偷色无码中文| 乱人伦人妻中文字幕无码久久网| 少妇特殊按摩高潮惨叫无码| 无码永久免费AV网站| 无码人妻aⅴ一区二区三区| 色国产色无码色欧美色在线| 东京热av人妻无码| 国产99久久九九精品无码| 亚洲中文字幕无码爆乳av中文| 黄A无码片内射无码视频| 日韩AV无码一区二区三区不卡毛片|