System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及生產調度,特別是涉及一種磁驅輸送系統的生產調度方法、裝置、電子設備、可讀存儲介質和程序產品。
技術介紹
1、磁驅輸送系統是一種廣泛應用于工業自動化領域的設備,其主要功能是通過磁力驅動小車在軌道上運行,實現物料的輸送和轉移。
2、在現代工業生產中,磁驅輸送線因其高效、靈活的特點,被廣泛應用于各種生產線中。然而,如何優化磁驅輸送線的生產節拍,減少生產中的空閑時間,以提高生產效率,降低生產成本,提升生產靈活性,是當前工業自動化領域亟待解決的問題。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種能夠適應實際生產環境以提高生產效率的磁驅輸送系統的生產調度方法、裝置、電子設備、可讀存儲介質和程序產品。
2、第一方面,本申請提供了一種磁驅輸送系統的生產調度方法,所述磁驅輸送系統包括磁驅輸送軌道和至少一個輸送設備,所述磁驅輸送軌道上設置有多個生產工位,所述方法包括:
3、獲取所述磁驅輸送系統的狀態監測數據,所述狀態監測數據包括監測的所述磁驅輸送系統中所述生產工位的負載以及所述輸送設備的位置;
4、將所述狀態監測數據輸入生產調度模型進行數據計算,得到調度策略,所述調度策略包括針對至少一個所述輸送設備的移動指令以及針對至少一個所述生產工位的狀態指令中的至少一種;所述生產調度模型基于所述磁驅輸送系統的樣本數據進行深度強化學習訓練得到;
5、根據所述調度策略對所述磁驅輸送系統進行調度處理。
6、在其中一個實施例中
7、在其中一個實施例中,所述生產調度模型的訓練方法包括:基于所述磁驅輸送系統確定對應的仿真環境,并初始化網絡參數;獲取所述仿真環境中磁驅輸送系統的初始狀態數據,根據所述初始狀態數據確定樣本調度策略;獲取基于所述樣本調度策略進行調度處理后所述磁驅輸送系統的狀態變化數據和樣本獎勵參數;根據所述初始狀態數據、所述樣本調度策略、所述狀態變化數據和所述樣本獎勵參數,確定基于所述仿真環境的樣本交互數據;根據所述樣本交互數據,基于深度強化學習算法更新所述網絡參數,得到訓練后的所述生產調度模型。
8、在其中一個實施例中,所述根據所述樣本交互數據,基于深度強化學習算法更新所述網絡參數,得到訓練后的所述生產調度模型,包括:基于所述樣本交互數據計算優勢函數,所述優勢函數用于衡量基于所述樣本調度策略進行調度處理的期望回報與所述初始狀態數據對應的價值估計之間的差異;根據所述優勢函數,通過最大化所述樣本調度策略的期望回報,更新策略網絡參數;根據所述優勢函數,通過最小化所述期望回報與所述價值估計之間的平方誤差,更新價值網絡參數,得到訓練后的所述生產調度模型。
9、在其中一個實施例中,所述樣本獎勵參數的獲取方法包括:根據所述狀態變化數據確定各生產工位的負載不平衡程度;獲取所述磁驅輸送系統的空閑時長和產品生產時長;根據所述負載不平衡程度、所述空閑時長和所述產品生產時長,基于預設的獎勵函數計算得到所述樣本獎勵參數。
10、在其中一個實施例中,所述獎勵函數采用:rt=-α·tidle-β·ttotal-γ·lbalance,其中,rt表示計算得到的t時刻基于所述樣本調度策略確定的樣本獎勵參數,tidle表示所述空閑時長,ttotal表示所述產品生產時長,lbalance表示所述負載不平衡程度,α、β、γ表示對應的權重。
11、在其中一個實施例中,所述深度強化學習算法基于深度q網絡、深度確定性策略梯度以及近端策略優化算法中的任一種實現。
12、第二方面,本申請還提供了一種磁驅輸送系統的生產調度裝置,所述磁驅輸送系統包括磁驅輸送軌道和至少一個輸送設備,所述磁驅輸送軌道上設置有多個生產工位,所述裝置包括:
13、狀態監測模塊,用于獲取所述磁驅輸送系統的狀態監測數據,所述狀態監測數據包括監測的所述磁驅輸送系統中所述生產工位的負載以及所述輸送設備的位置;
14、策略獲取模塊,用于將所述狀態監測數據輸入生產調度模型進行數據計算,得到調度策略,所述調度策略包括針對至少一個所述輸送設備的移動指令以及針對至少一個所述生產工位的狀態指令中的至少一種;所述生產調度模型基于所述磁驅輸送系統的樣本數據進行深度強化學習訓練得到;
15、調度處理模塊,用于根據所述調度策略對所述磁驅輸送系統進行調度處理。
16、第三方面,本申請還提供了一種電子設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現上述的方法的步驟。
17、第四方面,本申請還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述的方法的步驟。
18、第五方面,本申請還提供了一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現上述的方法的步驟。
19、上述磁驅輸送系統的生產調度方法、裝置、電子設備、可讀存儲介質和程序產品,通過獲取生產環境中磁驅輸送系統的狀態監測數據,并將狀態監測數據輸入預先訓練的生產調度模型進行數據計算,得到調度策略,并根據調度策略對磁驅輸送系統進行調度處理。從而減少輸送設備的等待時長以及減少生產工位的空閑時長,以提高生產效率,降低生產成本。又由于本實施例中的生產調度模型是通過與仿真環境的交互,基于磁驅輸送系統的樣本數據進行深度強化學習模型訓練后得到的,因此,模型可以理解磁驅輸送系統的動態特性,逐步學習和優化調度策略,從而能夠適應實際生產環境動態變化,以滿足實際生產環境。
本文檔來自技高網...【技術保護點】
1.一種磁驅輸送系統的生產調度方法,其特征在于,所述磁驅輸送系統包括磁驅輸送軌道和至少一個輸送設備,所述磁驅輸送軌道上設置有多個生產工位,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述生產調度模型的訓練方法包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述樣本交互數據,基于深度強化學習算法更新所述網絡參數,得到訓練后的所述生產調度模型,包括:
4.根據權利要求2所述的方法,其特征在于,所述樣本獎勵參數的獲取方法包括:
5.根據權利要求4所述的方法,其特征在于,所述獎勵函數采用:
6.根據權利要求2至5任一項所述的方法,其特征在于,
7.一種磁驅輸送系統的生產調度裝置,其特征在于,所述磁驅輸送系統包括磁驅輸送軌道和至少一個輸送設備,所述磁驅輸送軌道上設置有多個生產工位,所述裝置包括:
8.一種電子設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述的方法的步驟。
9.一種計算機可讀存儲介
10.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
...【技術特征摘要】
1.一種磁驅輸送系統的生產調度方法,其特征在于,所述磁驅輸送系統包括磁驅輸送軌道和至少一個輸送設備,所述磁驅輸送軌道上設置有多個生產工位,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述生產調度模型的訓練方法包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述樣本交互數據,基于深度強化學習算法更新所述網絡參數,得到訓練后的所述生產調度模型,包括:
4.根據權利要求2所述的方法,其特征在于,所述樣本獎勵參數的獲取方法包括:
5.根據權利要求4所述的方法,其特征在于,所述獎勵函數采用:
6.根據權利要求2至5任一項所述的方法,其特征在于...
【專利技術屬性】
技術研發人員:沈佳能,葉進余,盧紅星,
申請(專利權)人:上??v葦科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。