圖像生成模型的訓練、圖像生成方法、裝置、設備和介質制造方法及圖紙

技術編號：44474617 閱讀：3 留言：0更新日期：2025-03-04 17:44

本公開實施例提供一種圖像生成模型的訓練、圖像生成方法、裝置、設備和介質，該方法包括：獲取第一圖像描述及其對應的第一樣本圖像；利用第一圖像描述，通過第一圖像生成模型，得到第一生成圖像；利用第一生成圖像和第一圖像描述，通過目標獎勵模型，得到預測權重值，預測權重值與第一生成圖像的圖像質量正相關，和/或，與第一圖像描述和第一生成圖像之間的匹配度正相關；基于第一生成圖像與第一樣本圖像之間的差異以及預測權重值，調整第一圖像生成模型的參數。

全部詳細技術資料下載

【技術實現步驟摘要】

本公開涉及計算，尤其涉及一種圖像生成模型的訓練、圖像生成方法、裝置、設備和介質。

技術介紹

1、圖像生成領域中，一般可以利用圖像描述(也可以稱為文本提示即prompt)來指導圖像的生成。具體的，根據圖像描述，通過基于內容生成技術的圖像生成模型，得到前述圖像描述相應的圖像。

2、在上述過程中，為了保證所生成圖像的質量，需要所利用的圖像生成模型具有更好的圖像生成能力，那么，如何提供一種訓練得到具有更好的圖像生成能力的圖像生成模型成為亟待解決的問題。

技術實現思路

1、本公開一個或多個實施例提供了一種圖像生成模型的訓練方法、裝置、設備和介質、以及圖像生成方法、裝置、設備和介質，以實現訓練得到具有更好的圖像生成能力的圖像生成模型。

2、根據第一方面，提供一種圖像生成模型的訓練方法，包括：

3、獲取第一圖像描述及其對應的第一樣本圖像；

4、利用所述第一圖像描述，通過第一圖像生成模型，得到第一生成圖像；

5、利用所述第一生成圖像和所述第一圖像描述，通過目標獎勵模型，得到預測權重值，所述預測權重值與所述第一生成圖像的圖像質量正相關，和/或，與所述第一圖像描述和所述第一生成圖像之間的匹配度正相關；

6、基于所述第一生成圖像與所述第一樣本圖像之間的差異以及所述預測權重值，調整所述第一圖像生成模型的參數。

7、在一種可選實施方式中，所述調整所述第一圖像生成模型的參數，包括：利用預設損失函數，根據所述第一生成圖像與所述第

8、在一種可選實施方式中，還包括：利用第一圖像描述輸，通過預訓練過的第二圖像生成模型，得到第二生成圖像；所述調整所述第一圖像生成模型的參數，包括：基于所述第一生成圖像與所述第一樣本圖像之間的差異、所述預測權重值以及所述第一生成圖像與所述第二生成圖像之間的差異，調整所述第一圖像生成模型的所述參數。本實施方式中，結合第一生成圖像與第二圖像生成模型所生成的第二生成圖像之間的差異，來調整第一圖像生成模型的參數，可以實現在提高第一圖像生成模型的圖像生成能力的同時，避免第一圖像生成模型所生成的圖像偏離第二圖像生成模型所生成的圖像過多，以避免出現第一圖像生成模型生成混亂的圖像(與所輸入的圖像描述不匹配的圖像)來欺騙目標獎勵模型，致使目標獎勵模型對第一圖像生成模型生成混亂的圖像輸出數值較高的預測權重值的情況的發生。

9、在一種可選實施方式中，所述調整所述第一圖像生成模型的所述參數，包括：基于所述第一生成圖像與所述第二生成圖像之間的差異，確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值；基于所述第一生成圖像與所述第一樣本圖像之間的差異、所述預測權重值以及所述圖像差異值，確定第一預測損失；以最小化所述第一預測損失為目標，調整所述第一圖像生成模型的參數本實施方式中，利用第一生成圖像和第二生成圖像之間的圖像差異值，來懲罰第一圖像生成模型所生成的圖像偏離第二圖像生成模型所生成的圖像太遠的情況，其中，圖像差異值越大懲罰越大，以避免出現第一圖像生成模型生成混亂的圖像來欺騙目標獎勵模型，致使目標獎勵模型對第一圖像生成模型生成混亂的圖像輸出數值較高的預測權重值的情況的發生。

10、在一種可選實施方式中，所述確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值，包括：利用預設散度算法，基于所述第一生成圖像和所述第二生成圖像之間的差異，確定散度值；基于所述散度值，確定所述圖像差異值。本實施方式中，利用預設散度算法，可以更準確地確定出第一生成圖像和第二生成圖像之間的圖像差異，進而可以更好的避免出現第一圖像生成模型生成混亂的圖像來欺騙目標獎勵模型，致使目標獎勵模型對第一圖像生成模型生成混亂的圖像輸出數值較高的預測權重值的情況的發生。

11、在一種可選實施方式中，所述第一樣本圖像為利用所述第二圖像生成模型，根據所述第一圖像描述而生成的圖像。本實施方式中，利用第二圖像生成模型，根據第一圖像描述而生成的圖像及相應的第一圖像描述所構成的圖文對的質量相對更好，利用該類圖文對訓練第一圖像生成模型，有助于訓練得到可以生成質量更好的圖像的第一圖像生成模型。

12、在一種可選實施方式中，還包括：獲取第二圖像描述及其對應的第二樣本圖像；利用所述第二圖像描述，通過所述第一圖像生成模型，得到第三生成圖像；利用所述第二樣本圖像與所述第三生成圖像之間的差異，確定第二預測損失；所述以最小化所述第一預測損失為目標，調整所述第一圖像生成模型的參數，包括：以最小化所述第一預測損失和所述第二預測損失為目標，調整所述第一圖像生成模型的參數。本實施方式中，在訓練第一圖像生成模型的過程中，還增加真實圖像及其對應的圖像描述對第一圖像生成模型進行訓練，增加了訓練第一圖像生成模型的數據的多樣性，更好的提高了第一圖像生成模型的圖像生成能力。

13、在一種可選實施方式中，還包括：獲取所述第三圖像描述以及所述第三樣本圖像；獲取與所述第三圖像描述及所述第三樣本圖像相對應的所述標簽權重值，所述標簽權重值與所述第三樣本圖像的圖像質量正相關，和/或，與所述第三圖像描述以及所述第三樣本圖像之間的匹配度正相關；利用所述第三圖像描述及所述第三樣本圖像，通過待訓練的獎勵模型，得到評估權重值；利用所述評估權重值和所述標簽權重值，確定第三預測損失；以最小化所述第三預測損失為目標，調整所述待訓練的獎勵模型，以得到達到第一收斂條件的目標獎勵模型。本實施方式中，利用第三圖像描述及第三樣本圖像，以及與其兩者相對應的標簽權重值，訓練待訓練的獎勵模型，以得到達到第一收斂條件的目標獎勵模型，可以實現對待訓練的獎勵模型的確定結果的監督訓練，保持其準確性，提高了待訓練的獎勵模型的確定結果的準確性。

14、在一種可選實施方式中，所述標簽權重值基于如下至少一個信息確定：所述第三樣本圖像的清晰度分值、所述第三樣本圖像的美學分值以及所述第三樣本圖像與所述第三圖像描述之間的匹配度值。本實施方式中，通過若干可以表征圖像的質量和/或圖像及其圖像描述的質量和匹配度的信息，來確定標簽權重值，在一定程度上，可以使得該標簽權重值可以更好的表征出人類對相應圖像及其圖像描述的質量評價，進而提高目標獎勵模型所輸出的預測權重值的準確性，使得預測權重值更適配人類反饋。

15、根據第二方面，提供一種圖像生成方法，包括：

16、獲取待處理圖像描述；

17、利用所述待處理圖像描述，通過利用第一方面所述的圖像生成模型的訓練方法訓練本文檔來自技高網...

【技術保護點】

1.一種圖像生成模型的訓練方法，包括：

2.如權利要求1所述的方法，其中，所述調整所述第一圖像生成模型的參數，包括：

3.如權利要求1所述的方法，還包括：

4.如權利要求3所述的方法，其中，所述調整所述第一圖像生成模型的所述參數，包括：

5.如權利要求4所述的方法，其中，所述確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值，包括：

6.如權利要求3所述的方法，其中，所述第一樣本圖像為利用所述第二圖像生成模型，根據所述第一圖像描述而生成的圖像。

7.如權利要求2所述的方法，還包括：

8.如權利要求1-7任一項所述的方法，還包括：

9.如權利要求1-7任一項所述的方法，其中，所述標簽權重值基于如下至少一個信息確定：所述第三樣本圖像的清晰度分值、所述第三樣本圖像的美學分值以及所述第三樣本圖像與所述第三圖像描述之間的匹配度值。

10.一種圖像生成方法，包括：

11.一種圖像生成模型的訓練裝置，包括：

12.一種圖像生成裝置，包括：

13.一

14.一種計算機可讀存儲介質，其上存儲有計算機程序，當所述計算機程序在計算機中執行時，令計算機執行權利要求1-10中任一項所述的方法。

...

【技術特征摘要】

1.一種圖像生成模型的訓練方法，包括：

2.如權利要求1所述的方法，其中，所述調整所述第一圖像生成模型的參數，包括：

3.如權利要求1所述的方法，還包括：

4.如權利要求3所述的方法，其中，所述調整所述第一圖像生成模型的所述參數，包括：

5.如權利要求4所述的方法，其中，所述確定所述第一生成圖像與所述第二生成圖像之間的圖像差異值，包括：

6.如權利要求3所述的方法，其中，所述第一樣本圖像為利用所述第二圖像生成模型，根據所述第一圖像描述而生成的圖像。

7.如權利要求2所述的方法，還包括：

8.如權利要求1-7任一項所述的方法，還包括：

9.如...

【專利技術屬性】
技術研發人員：吳捷，
申請(專利權)人：北京字跳網絡技術有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術