System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及數據壓縮,特別地涉及一種潛在空間壓縮方法、解壓縮方法、裝置、設備和程序產品。
技術介紹
1、自從openai推出chatgpt以來,許多行業對人工智能(ai)的興趣顯著增加。大型語言模型(large?language?models,llms)在許多不同領域提供了驚人的能力提升,生成圖像和視頻的技術也快速進步。通過簡單的文本、圖像或視頻輸入,可以生成逼真的圖像或視頻序列。gpu計算的快速發展和應用使得使用采用生成式ai生成視頻和圖像變得更容易,例如穩定擴散方法生成圖像,使用sora生成視頻。在互動生成圖像或視頻的場景下,需要在進行生成的數據中心和提供輸入或觀看生成視頻的終端用戶之間進行某種形式的壓縮通信,現有的圖像數據壓縮方法存在壓縮比率低,成本高的問題。
技術實現思路
1、為了解決或至少部分地解決上述技術問題,本申請提供了一種潛在空間壓縮方法、解壓縮方法、裝置、設備和程序產品,能夠提高圖像數據的壓縮比率,降低圖像數據壓縮成本。
2、第一方面,本申請提供了一種潛在空間壓縮方法,應用于編碼端設備,所述方法包括:
3、獲取生成式ai產生的第一潛在變量;
4、通過神經網絡壓縮模型對所述第一潛在變量進行壓縮,得到壓縮后的第二潛在變量,其中,所述神經網絡壓縮模型包括神經網絡下采樣模型和算術編碼模型,所述神經網絡下采樣模型用于對所述第一潛在變量進行壓縮,得到下采樣后的第一潛在變量;所述算術編碼模型用于對所述下采樣后的第一潛在變量進行無損高斯算術編碼,
5、將壓縮后的第二潛在變量傳輸至解碼端,以使所述解碼端對所述第二潛在變量進行解碼,得到解碼后的目標圖像。
6、第二方面,本申請提供了一種潛在空間解壓縮方法,應用于解碼端設備,所述方法包括:
7、接收編碼端發送的壓縮后的第二潛在變量;
8、通過算術編碼模型對所述第二潛在變量進行解碼,得到解碼后的第二潛在變量;
9、通過神經網絡上采樣模型對所述解碼后的第二潛在變量進行解壓縮,得到上采樣后的第一潛在變量;
10、通過變分自編碼器對所述上采樣后的第一潛在變量進行解碼,得到目標圖像。
11、第三方面,本申請提供了一種潛在空間壓縮裝置,包括:
12、獲取模塊,用于獲取生成式ai產生的第一潛在變量;
13、壓縮模塊,用于通過神經網絡壓縮模型對所述第一潛在變量進行壓縮,得到壓縮后的第二潛在變量,其中,所述神經網絡壓縮模型包括神經網絡下采樣模型和算術編碼模型,所述神經網絡下采樣模型用于對所述第一潛在變量進行壓縮,得到下采樣后的第一潛在變量;所述算術編碼模型用于對所述下采樣后的第一潛在變量進行無損高斯算術編碼,得到編碼后的第二潛在變量;
14、發送模塊,用于將壓縮后的第二潛在變量傳輸至解碼端,以使所述解碼端對所述第二潛在變量進行解碼,得到解碼后的目標圖像。第三方面,本申請提供了一種圖像壓縮裝置,包括:
15、第四方面,本申請提供了一種潛在空間解壓縮裝置,包括:
16、接收模塊,用于接收編碼端發送的壓縮后的第二潛在變量;
17、解碼模塊,用于通過算術編碼模型對所述第二潛在變量進行解碼,得到解碼后的第二潛在變量;通過神經網絡上采樣模型對所述解碼后的第二潛在變量進行解壓縮,得到上采樣后的第一潛在變量;通過變分自編碼器對所述上采樣后的第一潛在變量進行解碼,得到目標圖像
18、第五方面,本申請的實施方式還提供了一種編碼端設備,包括處理器和存儲器;以及一個或多個程序,所述一個或多個程序被存儲在所述存儲器中,并且被配置成由所述處理器執行,所述程序包括用于如第一方面所述的潛在空間壓縮方法的步驟。
19、第六方面,本申請的實施方式還提供了一種解碼端設備,包括處理器和存儲器;以及一個或多個程序,所述一個或多個程序被存儲在所述存儲器中,并且被配置成由所述處理器執行,所述程序包括用于如第二方面所述的潛在空間解壓縮方法的步驟。
20、第七方面,本申請的實施方式還提供了一種計算機可讀程序產品,存儲有程序指令,程序指令被計算機執行時使得計算機執行第一方面所述的潛在空間壓縮方法或第二方面所述的潛在空間解壓縮方法。
21、本申請的實施方式通過獲取生成式ai產生的第一潛在變量;通過神經網絡壓縮模型對所述第一潛在變量進行壓縮,得到壓縮后的第二潛在變量,其中,神經網絡壓縮模型包括神經網絡下采樣模型和算術編碼模型,神經網絡下采樣模型用于對第一潛在變量進行壓縮,得到下采樣后的第一潛在變量;算術編碼模型用于對下采樣后的第一潛在變量進行無損高斯算術編碼,得到編碼后的第二潛在變量;將壓縮后的第二潛在變量傳輸至解碼端,以使解碼端對第二潛在變量進行解碼,得到解碼后的目標圖像,通過算術編碼模型對下采樣后的第一潛在變量進行無損高斯算術編碼,實現無損壓縮,能夠有效地利用數據的結構信息,實現高效的無損壓縮,能夠更高效地對第一潛在變量進行壓縮,進而提高圖像數據的壓縮比率,降低圖像數據壓縮成本。
本文檔來自技高網...【技術保護點】
1.一種潛在空間壓縮方法,其特征在于,應用于編碼端設備,所述方法包括:
2.根據權利要求1所述的潛在空間壓縮方法,其特征在于,所述獲取生成式AI產生的第一潛在變量,包括
3.根據權利要求1所述的潛在空間壓縮方法,其特征在于,所述通過神經網絡壓縮模型對所述第一潛在變量進行壓縮,得到壓縮后的第二潛在變量,包括:
4.根據權利要求3所述的潛在空間壓縮方法,其特征在于,所述通過所述算術編碼模型對所述量化后的第一潛在變量進行無損高斯算術編碼,得到編碼后的第二潛在變量,包括:
5.根據權利要求4所述的潛在空間壓縮方法,其特征在于,所述神經網絡壓縮模型包括第一超先驗模型和第二超先驗模型,通過算術編碼模型對下采樣后的第一潛在變量估計高斯方差,得到高斯方差,包括:
6.根據權利要求5所述的潛在空間壓縮方法,其特征在于,所述方法還包括:
7.一種潛在空間解壓縮方法,其特征在于,應用于解碼端設備,所述方法包括:
8.根據權利要求7所述的潛在空間解壓縮方法,其特征在于,所述方法還包括:
9.根據權利要求8所述
10.一種潛在空間壓縮裝置,其特征在于,包括:
11.一種潛在空間解壓縮裝置,其特征在于,包括:
12.一種編碼端設備,其特征在于,包括處理器和存儲器;以及一個或多個程序,所述一個或多個程序被存儲在所述存儲器中,并且被配置成由所述處理器執行,所述程序包括用于如權利要求1至6中任一項所述的潛在空間壓縮方法的步驟。
13.一種解碼端設備,其特征在于,包括處理器和存儲器;以及一個或多個程序,所述一個或多個程序被存儲在所述存儲器中,并且被配置成由所述處理器執行,所述程序包括用于如權利要求7至9中任一項所述的潛在空間解壓縮方法的步驟。
14.一種計算機程序產品,其特征在于,所述計算機程序產品中的計算機程序在被處理器執行時,能夠實現權利要求1至6中任一項所述的潛在空間壓縮方法的步驟或權利要求7至9中任一項所述的潛在空間解壓縮方法的步驟。
...【技術特征摘要】
1.一種潛在空間壓縮方法,其特征在于,應用于編碼端設備,所述方法包括:
2.根據權利要求1所述的潛在空間壓縮方法,其特征在于,所述獲取生成式ai產生的第一潛在變量,包括
3.根據權利要求1所述的潛在空間壓縮方法,其特征在于,所述通過神經網絡壓縮模型對所述第一潛在變量進行壓縮,得到壓縮后的第二潛在變量,包括:
4.根據權利要求3所述的潛在空間壓縮方法,其特征在于,所述通過所述算術編碼模型對所述量化后的第一潛在變量進行無損高斯算術編碼,得到編碼后的第二潛在變量,包括:
5.根據權利要求4所述的潛在空間壓縮方法,其特征在于,所述神經網絡壓縮模型包括第一超先驗模型和第二超先驗模型,通過算術編碼模型對下采樣后的第一潛在變量估計高斯方差,得到高斯方差,包括:
6.根據權利要求5所述的潛在空間壓縮方法,其特征在于,所述方法還包括:
7.一種潛在空間解壓縮方法,其特征在于,應用于解碼端設備,所述方法包括:
8.根據權利要求7所述的潛在空間解壓縮方法,其特征在...
【專利技術屬性】
技術研發人員:約翰·普萊斯特,徐林,
申請(專利權)人:镕銘微電子濟南有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。