System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于人工智能,特別涉及一種基于語法層轉換的tvm量化模型的構建方法及相關裝置。
技術介紹
1、參數量化是一種在深度學習領域廣泛應用的模型壓縮與加速技術,它通過減少模型參數的表示位數來降低模型的計算和存儲開銷。參數量化是指將深度學習模型中的參數(如權重、激活值等)從原始的浮點數表示(通常是32位)轉換為較低位寬的定點數或整數表示(如16位、8位、4位、2位甚至1位)。
2、參數量化的優點在于減少存儲空間和內存占用:通過降低參數的位寬,可以顯著減少模型參數的存儲空間和運行時內存占用。例如,將32位浮點型參數量化為8位整型,可以縮小約75%的存儲空間。參數量化能夠加快運算速度:較低位寬的參數在硬件上更容易處理,可以加快模型的運算速度。同時,讀取和處理較低位寬的參數所需的帶寬和功耗也更低。參數量化能夠提升邊緣設備部署能力:對于計算資源有限的邊緣設備和嵌入式設備來說,參數量化使得深度學習模型更容易在這些設備上部署和運行。
3、參數量化可以減小模型大小,提高計算效率,方便專用硬件加速,甚至提高模型泛化能力,是神經網絡實用化部署的關鍵步驟,也是tvm(tensor?virtual?machine,意為張量虛擬機,一款開源的、端到端的深度學習模型編譯框架)一個關鍵模塊。目前tvm框架的量化算法有限,導致構建出的一些tvm量化模型精度下降。一些第三方模型量化工具中的更優算法不能被tvm框架直接使用。為tvm框架新增量化算法或傳統基于計算圖語義解析和轉換的方法,存在代碼量大,結構復雜、調試和維護難的問題。
< ...【技術保護點】
1.一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,包括:
2.根據權利要求1所述的一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,所述結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟,包括:
3.根據權利要求1所述的一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,所述根據語法規則,解析所述Python推理腳本,并結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟中,通過將Python腳本在語法層逐行轉換為TVM?relay語法,實現將Python推理腳本轉換為TVM?relay推理腳本。
4.根據權利要求1所述的一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,所述獲取待參數量化模型的PyTorch模型文件和量化參數文件的步驟,具體包括:
5.根據權利要求1所述的一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,所述根據語法規則,解析所述
6.根據權利要求5所述的一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,所述根據語法規則,解析所述Python推理腳本,并結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟中,所述語法轉換規則具體為:
7.根據權利要求2所述的一種基于語法層轉換的TVM量化模型的構建方法,其特征在于,所述將解析后的Python推理腳本轉換為TVM?relay推理腳本的過程中,如果遇到需量化計算算子,參考量化參數文件,在TVM?relay推理中插入相應的量化計算操作語句的步驟中,針對需要量化的計算算子,從量化參數文件中讀取量化參數,生成對應的Relay量化計算操作語句;所述量化參數包括輸入尺度、輸入偏移、權重尺度、權重偏移、輸出尺度和輸出偏移中的至少一種。
8.一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,包括:
9.根據權利要求8所述的一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,所述結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟中,判斷是否需要量化計算算子,若需要量化計算算子,則參考所述量化參數文件,在TVM?relay推理腳本中插入相應的量化計算操作語句;
10.根據權利要求8所述的一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,所述根據語法規則,解析所述Python推理腳本,并結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟中,通過將Python腳本語法層逐行轉換為TVM?relay語法,實現將Python推理腳本轉換為TVM?relay推理腳本。
11.根據權利要求8所述的一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,所述獲取待參數量化模型的PyTorch模型文件和量化參數文件的步驟,具體包括:
12.根據權利要求8所述的一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,所述根據語法規則,解析所述Python推理腳本,并結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟中,所述語法規則包括Python腳本解析語法定義和Relay腳本生成語法定義,其中:
13.根據權利要求12所述的一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,所述根據語法規則,解析所述Python推理腳本,并結合PyTorch模型文件中模型信息,根據語法轉換規則,將解析后的Python推理腳本轉換為TVM?relay推理腳本的步驟中,所述語法轉換規則具體為:
14.根據權利要求9所述的一種基于語法層轉換的TVM量化模型的構建裝置,其特征在于,所述將解析后的Python推理腳本轉換為TVM?relay推理腳本的過程中,如果遇到需量化計算算子,參考量化參數文件,在TVM?relay推理中插入相應的量化計算操作語句的步驟中,針對需要量化的計算算子,從量化參數文件中讀取量化參數,生成對應的R...
【技術特征摘要】
1.一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,包括:
2.根據權利要求1所述的一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,所述結合pytorch模型文件中模型信息,根據語法轉換規則,將解析后的python推理腳本轉換為tvm?relay推理腳本的步驟,包括:
3.根據權利要求1所述的一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,所述根據語法規則,解析所述python推理腳本,并結合pytorch模型文件中模型信息,根據語法轉換規則,將解析后的python推理腳本轉換為tvm?relay推理腳本的步驟中,通過將python腳本在語法層逐行轉換為tvm?relay語法,實現將python推理腳本轉換為tvm?relay推理腳本。
4.根據權利要求1所述的一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,所述獲取待參數量化模型的pytorch模型文件和量化參數文件的步驟,具體包括:
5.根據權利要求1所述的一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,所述根據語法規則,解析所述python推理腳本,并結合pytorch模型文件中模型信息,根據語法轉換規則,將解析后的python推理腳本轉換為tvm?relay推理腳本的步驟中,所述語法規則包括python腳本解析語法定義和relay腳本生成語法定義,其中:
6.根據權利要求5所述的一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,所述根據語法規則,解析所述python推理腳本,并結合pytorch模型文件中模型信息,根據語法轉換規則,將解析后的python推理腳本轉換為tvm?relay推理腳本的步驟中,所述語法轉換規則具體為:
7.根據權利要求2所述的一種基于語法層轉換的tvm量化模型的構建方法,其特征在于,所述將解析后的python推理腳本轉換為tvm?relay推理腳本的過程中,如果遇到需量化計算算子,參考量化參數文件,在tvm?relay推理中插入相應的量化計算操作語句的步驟中,針對需要量化的計算算子,從量化參數文件中讀取量化參數,生成對應的relay量化計算操作語句;所述量化參數包括輸入尺度、輸入偏移、權重尺度、權重偏移、輸出尺度和輸出偏移中的至少一種。
8.一種基于語法層轉換的tvm量化模型的構建裝置,其特征在于,包括:
9.根據權利要求8所述的一種基于語法層轉換的tvm量化模型的構建裝...
【專利技術屬性】
技術研發人員:林龍,楊訸,史存存,王劉旺,羅華峰,于軍,
申請(專利權)人:國網智能電網研究院有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。