System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本專利技術屬于邊緣智能領域,涉及一種基于推理請求卸載的能耗優(yōu)化方法及系統(tǒng)。
技術介紹
1、隨著深度學習技術的蓬勃發(fā)展,多種新型人工智能應用例如圖像分類、視頻分析、人臉識別等已經逐漸成為日常生活的一部分,用戶對不同智能應用的需求隨之增加。為了實現(xiàn)移動設備獨立完成推理任務,目前已出現(xiàn)了各種能夠提高移動設備計算能力的技術。但是,由于移動設備的存儲資源有限,自身無法部署所需要的所有模型。移動邊緣計算被公認為是一種有前途的解決方案。然而,獨立邊緣服務器的資源有限,當較多的用戶將推理請求卸載至邊緣服務器時,可能會引起激烈的資源競爭,從而導致分配到的資源無法滿足用戶服務體驗要求。
2、針對此問題,考慮引入d2d技術來充分利用部署在移動設備上的模型和空閑資源,從而協(xié)作獲得多類型推理服務。但是,由于移動設備的電池容量有限,不能忽略d2d協(xié)作推理所消耗的能量。
3、現(xiàn)有技術針對用戶的推理請求提出了一系列的卸載決策和資源配置方案。然而,沒有考慮到用戶的推理請求可能與其移動設備中部署的模型不兼容的情況,忽略了移動設備可以通過d2d技術來共享現(xiàn)有技術提供的推理服務和空閑資源,從而減少獨立服務器的資源競爭。
4、因此,如何找到一種能夠在降低移動設備能耗的同時,通過d2d協(xié)作和端邊協(xié)作為用戶提供多類型推理服務的有效方法,是本領域技術人員需解決的技術問題。
技術實現(xiàn)思路
1、鑒于以上所述現(xiàn)有技術的缺點,本專利技術提供一種基于推理請求卸載的能耗優(yōu)化方法及系統(tǒng)。考慮到用戶對不同深度
2、第一個方面,本專利技術提供一種基于推理請求卸載的能耗優(yōu)化方法,包括以下步驟:
3、步驟1:將推理請求信息、移動設備的模型部署信息和計算資源信息發(fā)送至邊緣服務器;
4、步驟2:構建用戶推理請求在本地執(zhí)行的移動設備能耗模型、移動設備將用戶推理清求發(fā)送至可協(xié)作移動設備執(zhí)行的移動設備能耗模型,以及移動設備將用戶推理請求發(fā)送至邊緣服務器執(zhí)行的移動設備能耗模型;
5、步驟3:邊緣服務器迭代調整推理請求的卸載方案,并求解各次迭代中卸載方案所對應的設備資源配置方案與移動設備總能耗;若連續(xù)多次調整卸載方案都無法降低移動設備總能耗,則將當前最低總能耗所對應的卸載方案與設備資源配置方案確立為最終方案;
6、步驟4:邊緣服務器將推理請求的卸載方案和設備資源配置方案結果發(fā)送至各個移動設備。
7、第二個方面,本專利技術提供一種基于推理請求卸載的能耗優(yōu)化系統(tǒng),包括:
8、信息發(fā)送模塊,用于將推理請求信息、移動設備的模型部署信息和計算資源信息發(fā)送至邊緣服務器;
9、推理請求構建模塊,用于構建用戶推理請求在本地執(zhí)行的移動設備能耗模型、移動設備將用戶推理清求發(fā)送至可協(xié)作移動設備執(zhí)行的移動設備能耗模型,以及移動設備將用戶推理請求發(fā)送至邊緣服務器執(zhí)行的移動設備能耗模型;
10、卸載方案調整模塊,用于邊緣服務器迭代調整推理請求的卸載方案,并求解各次迭代中卸載方案所對應的設備資源配置方案與移動設備總能耗;若連續(xù)多次調整卸載方案都無法降低移動設備總能耗,則將當前最低總能耗所對應的卸載方案與設備資源配置方案確立為最終方案;
11、卸載方案分配模塊,用于邊緣服務器將推理請求的卸載方案和設備資源配置方案結果發(fā)送至各個移動設備。
12、第三個方面,本專利技術提供一種電子設備,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器被設置為通過所述計算機程序執(zhí)行本專利技術第一方面實施例所述的方法。
13、第四個方面,本專利技術提供一種計算機可讀存儲介質,所述計算機可讀存儲介質包括存儲的計算機程序,其中,所述計算機程序運行時執(zhí)行本專利技術第一方面實施例所述的方法。
14、與現(xiàn)有技術相比,本專利技術技術方案的有益效果是:
15、本專利技術考慮了用戶對不同深度學習應用的需求多樣性,構建用戶推理請求在本地執(zhí)行的移動設備能耗模型、移動設備將用戶推理清求發(fā)送至可協(xié)作移動設備執(zhí)行的移動設備能耗模型,以及移動設備將用戶推理請求發(fā)送至邊緣服務器執(zhí)行的移動設備能耗模型,邊緣服務器迭代調整推理請求的卸載方案,并求解各次迭代中卸載方案所對應的設備資源配置方案與移動設備總能耗;使用d2d技術來充分利用移動設備的空閑資源以協(xié)作提供多類型推理服務,降低移動設備總能耗。
本文檔來自技高網...【技術保護點】
1.一種基于推理請求卸載的能耗優(yōu)化方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的方法,其特征在于,所述步驟1具體為:
3.根據(jù)權利要求1所述的方法,其特征在于,步驟2所述獲取所有移動設備的總能耗,具體為:
4.根據(jù)權利要求3所述的方法,其特征在于,所述步驟3具體為:
5.根據(jù)權利要求4所述的方法,其特征在于,步驟3.1,具體為:
6.根據(jù)權利要求5所述的方法,其特征在于,步驟3.2所述迭代地調整推理請求的卸載方案,具體為:
7.根據(jù)權利要求6中所述的方法,其特征在于,所述步驟3.3具體為:
8.一種基于推理請求卸載的能耗優(yōu)化系統(tǒng),使用上述權利要求1~7任一項所述基于推理請求卸載的能耗優(yōu)化方法,其特征在于,包括:
9.一種電子設備,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計算機程序,所述處理器被設置為通過所述計算機程序執(zhí)行所述權利要求1至7中任一項所述的方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質包括存儲的計算機程序,其中,所
...【技術特征摘要】
1.一種基于推理請求卸載的能耗優(yōu)化方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的方法,其特征在于,所述步驟1具體為:
3.根據(jù)權利要求1所述的方法,其特征在于,步驟2所述獲取所有移動設備的總能耗,具體為:
4.根據(jù)權利要求3所述的方法,其特征在于,所述步驟3具體為:
5.根據(jù)權利要求4所述的方法,其特征在于,步驟3.1,具體為:
6.根據(jù)權利要求5所述的方法,其特征在于,步驟3.2所述迭代地調整推理請求的卸載方案,具體為:
7.根據(jù)權利要求...
【專利技術屬性】
技術研發(fā)人員:武繼剛,曾梓榆,黃家樂,吳嘉鑫,
申請(專利權)人:廣東工業(yè)大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。