System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本公開涉及人工智能,尤其涉及計(jì)算機(jī)視覺、深度學(xué)習(xí)、大模型等,可應(yīng)用于aigc基于人工智能的內(nèi)容生成等場景,更具體地,涉及一種圖像生成方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)和程序產(chǎn)品。
技術(shù)介紹
1、生成式人工智能(artificial?intelligence?generated?content,aigc)是指基于生成對(duì)抗網(wǎng)絡(luò)、大型預(yù)訓(xùn)練模型等人工智能的技術(shù)方法,通過已有數(shù)據(jù)的學(xué)習(xí)和識(shí)別,以適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。
2、在一個(gè)示例中,可以利用生成式人工智能技術(shù)來生成表情包(即emoticon)。表情包是指以時(shí)下流行的明星、語錄、動(dòng)漫、影視截圖為素材,配上一系列相匹配的文字,用以表達(dá)特定的情感的方式。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本公開提供了一種圖像生成方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)和程序產(chǎn)品。
2、根據(jù)本公開的一個(gè)方面,提供了一種圖像生成方法,包括:根據(jù)風(fēng)格配置信息,在圖像生成模型包括的多個(gè)候選處理路徑中,確定m個(gè)目標(biāo)處理路徑,其中,上述候選處理路徑與候選風(fēng)格一一對(duì)應(yīng),上述風(fēng)格配置信息用于指示至少一個(gè)目標(biāo)風(fēng)格,上述圖像生成模型還包括預(yù)訓(xùn)練模塊,m為正整數(shù);利用上述m個(gè)目標(biāo)處理路徑,對(duì)圖像描述進(jìn)行處理,得到調(diào)整信息,其中,上述調(diào)整信息用于引導(dǎo)上述圖像生成模型基于上述至少一個(gè)目標(biāo)風(fēng)格對(duì)圖像生成過程進(jìn)行微調(diào);以及,基于上述調(diào)整信息,對(duì)利用上述預(yù)訓(xùn)練模塊處理上述圖像描述得到的輸出進(jìn)行調(diào)整,得到具有上述至少一個(gè)目標(biāo)風(fēng)格的目標(biāo)圖像。
3、根據(jù)本公開的另一個(gè)
4、根據(jù)本公開的另一方面,提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)程序,其中,上述一個(gè)或多個(gè)處理器執(zhí)行上述一個(gè)或多個(gè)計(jì)算機(jī)程序以實(shí)現(xiàn)上述方法的步驟。
5、根據(jù)本公開的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序或指令,上述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。
6、根據(jù)本公開的另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,上述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。
7、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種圖像生成方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,在M=1的情況下,所述風(fēng)格配置信息用于切換所述目標(biāo)風(fēng)格;
3.根據(jù)權(quán)利要求1所述的方法,其中,在M>1的情況下,所述風(fēng)格配置信息用于融合所述目標(biāo)風(fēng)格;
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述基于所述調(diào)整信息,對(duì)利用所述預(yù)訓(xùn)練模塊處理所述圖像描述得到的輸出進(jìn)行調(diào)整,得到具有所述至少一個(gè)目標(biāo)風(fēng)格的目標(biāo)圖像包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述注意力策略包括交叉注意力策略,所述調(diào)整信息包括第一鍵矩陣、第一值矩陣和第一查詢矩陣,所述中間信息包括第二鍵矩陣、第二值矩陣和第二查詢矩陣;
6.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述風(fēng)格配置信息包括多個(gè)所述候選風(fēng)格各自的配置參數(shù);
7.根據(jù)權(quán)利要求6所述的方法,其中,所述風(fēng)格配置信息的獲得方式包括以下之一:
8.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述圖像生成模型是利用以下方式訓(xùn)練得到的:
9.一種圖像生成裝置,包括:
10.根
11.根據(jù)權(quán)利要求9所述的裝置,其中,在M>1的情況下,所述風(fēng)格配置信息用于融合所述目標(biāo)風(fēng)格;
12.根據(jù)權(quán)利要求9至11中任一項(xiàng)所述的裝置,其中,所述生成模塊包括:
13.根據(jù)權(quán)利要求12所述的裝置,其中,所述注意力策略包括交叉注意力策略,所述調(diào)整信息包括第一鍵矩陣、第一值矩陣和第一查詢矩陣,所述中間信息包括第二鍵矩陣、第二值矩陣和第二查詢矩陣;
14.根據(jù)權(quán)利要求9至11中任一項(xiàng)所述的裝置,其中,所述風(fēng)格配置信息包括多個(gè)所述候選風(fēng)格各自的配置參數(shù);
15.根據(jù)權(quán)利要求14所述的裝置,其中,所述風(fēng)格配置信息的獲得方式包括以下之一:
16.根據(jù)權(quán)利要求9至11中任一項(xiàng)所述的裝置,其中,所述圖像生成模型是利用以下方式訓(xùn)練得到的:
17.一種電子設(shè)備,包括:
18.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序或指令,其特征在于,所述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1~8中任一項(xiàng)所述方法的步驟。
19.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,其特征在于,所述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1~8中任一項(xiàng)所述方法的步驟。
...【技術(shù)特征摘要】
1.一種圖像生成方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,在m=1的情況下,所述風(fēng)格配置信息用于切換所述目標(biāo)風(fēng)格;
3.根據(jù)權(quán)利要求1所述的方法,其中,在m>1的情況下,所述風(fēng)格配置信息用于融合所述目標(biāo)風(fēng)格;
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述基于所述調(diào)整信息,對(duì)利用所述預(yù)訓(xùn)練模塊處理所述圖像描述得到的輸出進(jìn)行調(diào)整,得到具有所述至少一個(gè)目標(biāo)風(fēng)格的目標(biāo)圖像包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述注意力策略包括交叉注意力策略,所述調(diào)整信息包括第一鍵矩陣、第一值矩陣和第一查詢矩陣,所述中間信息包括第二鍵矩陣、第二值矩陣和第二查詢矩陣;
6.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述風(fēng)格配置信息包括多個(gè)所述候選風(fēng)格各自的配置參數(shù);
7.根據(jù)權(quán)利要求6所述的方法,其中,所述風(fēng)格配置信息的獲得方式包括以下之一:
8.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述圖像生成模型是利用以下方式訓(xùn)練得到的:
9.一種圖像生成裝置,包括:
10.根據(jù)權(quán)利要求9所述的裝置,其中,在m=1的情況下,所述風(fēng)格配置信息用于切換所述目標(biāo)風(fēng)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳軍如,
申請(專利權(quán))人:北京百度網(wǎng)訊科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。