• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng)技術(shù)方案

    技術(shù)編號(hào):39058283 閱讀:26 留言:0更新日期:2023-10-12 19:51
    本發(fā)明專利技術(shù)公開了基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng),涉及城軌車站資源調(diào)度技術(shù)領(lǐng)域,現(xiàn)提出如下方案,包括數(shù)據(jù)收集單元、人員調(diào)度優(yōu)化單元、PPO智能體、本地LLM語言模型和決策方案文本輸出單元;本發(fā)明專利技術(shù)具有更全面的信息理解和生成能力,通過人員調(diào)度決策算法與LLM結(jié)合,能夠更好地理解和生成與人員調(diào)度相關(guān)的自然語言信息,從而更準(zhǔn)確地指導(dǎo)決策過程,而且具有更靈活的決策優(yōu)化能力,利用LLM的優(yōu)勢(shì)來解決復(fù)雜的人員調(diào)度問題,提供更準(zhǔn)確和智能的決策支持,還通過PPO算法與LLM相結(jié)合,通過學(xué)習(xí)海量的文本數(shù)據(jù)來生成文本,實(shí)現(xiàn)自我學(xué)習(xí)和訓(xùn)練的能力,更好地應(yīng)對(duì)不確定性,從而生成適應(yīng)各種情況的調(diào)度策略。從而生成適應(yīng)各種情況的調(diào)度策略。從而生成適應(yīng)各種情況的調(diào)度策略。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng)


    [0001]本專利技術(shù)涉及城軌車站資源調(diào)度
    ,尤其涉及基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng)。

    技術(shù)介紹

    [0002]城市軌道交通是城市公共交通的骨干,具有節(jié)能、省地、運(yùn)量大、全天候、少污染又安全等特點(diǎn),屬綠色環(huán)保交通體系。
    [0003]軌道調(diào)度是指從事軌道交通列車運(yùn)行組織指揮工作的工作人員根據(jù)各行車崗位的運(yùn)作對(duì)車站資源進(jìn)行指揮和協(xié)調(diào),根據(jù)運(yùn)營時(shí)刻表執(zhí)行,根據(jù)行車、供電、環(huán)控各崗位的運(yùn)作對(duì)車站資源進(jìn)行職位和協(xié)調(diào),監(jiān)控系統(tǒng)運(yùn)行狀態(tài),處理緊急事件,調(diào)整列車運(yùn)行。
    [0004]現(xiàn)有的調(diào)度系統(tǒng)通常只能處理結(jié)構(gòu)化數(shù)據(jù),而且通常使用確定性規(guī)則和算法進(jìn)行決策優(yōu)化,但在復(fù)雜的人員調(diào)度問題中,存在許多約束條件,還存在許多不確定性因素,例如員工的臨時(shí)請(qǐng)假、任務(wù)的突發(fā)性質(zhì)等,傳統(tǒng)模型往往難以有效應(yīng)對(duì)這些不確定性,并生成具有魯棒性的調(diào)度方案,而且傳統(tǒng)模型可能在處理大規(guī)模數(shù)據(jù)和實(shí)時(shí)決策時(shí)面臨效率和實(shí)時(shí)性的挑戰(zhàn)。

    技術(shù)實(shí)現(xiàn)思路

    [0005]本專利技術(shù)提出的基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng),解決了現(xiàn)有的調(diào)度系統(tǒng)通常只能處理結(jié)構(gòu)化數(shù)據(jù),而且通常使用確定性規(guī)則和算法進(jìn)行決策優(yōu)化,但在復(fù)雜的人員調(diào)度問題中,存在許多約束條件,還存在許多不確定性因素,例如員工的臨時(shí)請(qǐng)假、任務(wù)的突發(fā)性質(zhì)等,傳統(tǒng)模型往往難以有效應(yīng)對(duì)這些不確定性,并生成具有魯棒性的調(diào)度方案,而且傳統(tǒng)模型可能在處理大規(guī)模數(shù)據(jù)和實(shí)時(shí)決策時(shí)面臨效率和實(shí)時(shí)性的挑戰(zhàn)的問題。
    [0006]為了實(shí)現(xiàn)上述目的,本專利技術(shù)采用了如下技術(shù)方案:
    [0007]基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng),包括數(shù)據(jù)收集單元、人員調(diào)度優(yōu)化單元、PPO智能體、本地LLM語言模型和決策方案文本輸出單元;
    [0008]所述數(shù)據(jù)收集單元用于收集地鐵車站歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理,所述數(shù)據(jù)收集單元將處理后的數(shù)據(jù)分別傳輸至人員調(diào)度優(yōu)化單元和PPO智能體;
    [0009]所述PPO智能體接收數(shù)據(jù)收集單元傳輸?shù)臍v史數(shù)據(jù),通過PPO算法學(xué)習(xí)歷史方案產(chǎn)生類似場(chǎng)景的數(shù)據(jù)并開始自我訓(xùn)練生成新的數(shù)據(jù),所述智能體將生成的新數(shù)據(jù)傳輸至人員調(diào)度優(yōu)化單元內(nèi);
    [0010]PPO算法如下:
    [0011][0012]θ是策略參數(shù);
    [0013]表示隨時(shí)間步長的經(jīng)驗(yàn)期望;
    [0014]r
    t
    是新老政策下概率的比值;
    [0015]是時(shí)間t的估計(jì)優(yōu)勢(shì);
    [0016]ε是一個(gè)超參數(shù),通常為0.1或0.2;
    [0017]所述人員調(diào)度優(yōu)化單元接收數(shù)據(jù)收集單元傳輸?shù)臍v史數(shù)據(jù)和PPO智能體生成的新數(shù)據(jù),所述人員調(diào)度優(yōu)化單元通過人員調(diào)度優(yōu)化算法根據(jù)歷史數(shù)據(jù)和新數(shù)據(jù)生成決策方案,并將決策方案?jìng)鬏斨帘镜豅LM語言模型內(nèi);
    [0018]所述本地LLM語言模型接收人員調(diào)度優(yōu)化單元傳輸?shù)臎Q策方案,所述本地LLM語言模型通過強(qiáng)大的自然語言處理能力和語境理解能力將決策方案重新理解和生成為自然語言文本,并將其傳輸至決策方案文本輸出單元,本地LLM語言模型能夠處理自然語言文本,具備強(qiáng)大的語義理解能力,通過人員調(diào)度優(yōu)化單元的人員調(diào)度決策算法與LLM結(jié)合,我們能夠更好地理解和生成與人員調(diào)度相關(guān)的自然語言信息,從而更準(zhǔn)確地指導(dǎo)決策過程;
    [0019]通過將人員調(diào)度決策算法與本地LLM語言模型結(jié)合具有更靈活的決策優(yōu)化能力,如在復(fù)雜的人員調(diào)度問題中,存在許多約束條件,例如員工的技能要求、工作時(shí)間限制、任務(wù)緊急性等,通過結(jié)合人員調(diào)度決策算法和LLM,更全面地考慮這些約束條件,并生成滿足各種限制的更優(yōu)調(diào)度方案;
    [0020]通過將人員調(diào)度決策算法與LLM結(jié)合,利用LLM的計(jì)算能力來加速搜索過程,并生成更優(yōu)的人員調(diào)度方案,LLM根據(jù)已有知識(shí)和數(shù)據(jù)進(jìn)行預(yù)測(cè)和推理,幫助決策算法更有針對(duì)性地搜索,從而得到更好的結(jié)果;
    [0021]在人員調(diào)度問題中,存在許多不確定性因素,例如員工的臨時(shí)請(qǐng)假、任務(wù)的突發(fā)性質(zhì)等,通過結(jié)合人員調(diào)度決策算法和LLM,利用LLM的語言生成能力和上下文理解能力,更好地應(yīng)對(duì)不確定性,從而生成適應(yīng)各種情況的調(diào)度策略;
    [0022]所述決策方案文本輸出單元接收本地LLM語言模型傳輸?shù)淖匀徽Z言文本并將其展示給工作人員查看。
    [0023]進(jìn)一步地,所述數(shù)據(jù)收集單元中的歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)包括乘客流量和列車運(yùn)行情況。
    [0024]進(jìn)一步地,所述數(shù)據(jù)收集單元中的預(yù)處理包括分詞、標(biāo)記化、去除噪聲和不必要的信息等。
    [0025]進(jìn)一步地,所述本地LLM語言模型的架構(gòu)具有捕捉語義和上下文信息的功能,且具備的記憶能力。
    [0026]進(jìn)一步地,所述本地LLM語言模型受訓(xùn)練數(shù)據(jù)的影響對(duì)數(shù)據(jù)中存在的偏見或不平衡進(jìn)行檢測(cè),并將這些問題反映出來,如果訓(xùn)練數(shù)據(jù)中存在性別或種族偏見,模型生成的文本可能會(huì)反映出這些偏見,處理數(shù)據(jù)的平衡和偏見是訓(xùn)練和應(yīng)用大型語言模型時(shí)的一個(gè)重要問題。
    [0027]進(jìn)一步地,所述本地LLM語言模型在生成結(jié)果后對(duì)生成結(jié)果進(jìn)行過濾和評(píng)估,并根據(jù)過濾和評(píng)估結(jié)果采取相應(yīng)的處理步驟,大型語言模型在生成文本時(shí)會(huì)出現(xiàn)準(zhǔn)確性和一致性的問題,模型可能會(huì)生成不準(zhǔn)確的信息或矛盾的內(nèi)容,這可能是由于模型的訓(xùn)練數(shù)據(jù)中存在錯(cuò)誤或矛盾的信息,或者是由于模型自身的局限性導(dǎo)致的,所以需要進(jìn)行過濾和評(píng)估。
    [0028]進(jìn)一步地,所述數(shù)據(jù)收集單元的輸出端與PPO智能體的輸入端相連接,所述PPO智能體的輸出端與人員調(diào)度優(yōu)化單元的輸入端相連接,所述人員調(diào)度優(yōu)化單元的輸出端與PPO智能體的輸入端相連接,所述人員調(diào)度優(yōu)化單元的輸出端與本地LLM語言模型的輸入端相連接,所述本地LLM語言模型的輸出端與決策方案文本輸出單元的輸入端相連接。
    [0029]與現(xiàn)有的技術(shù)相比,本專利技術(shù)的有益效果是:
    [0030]本系統(tǒng)具有更全面的信息理解和生成能力,通過人員調(diào)度決策算法與LLM結(jié)合,能夠更好地理解和生成與人員調(diào)度相關(guān)的自然語言信息,從而更準(zhǔn)確地指導(dǎo)決策過程,而且具有更靈活的決策優(yōu)化能力,利用LLM的優(yōu)勢(shì)來解決復(fù)雜的人員調(diào)度問題,提供更準(zhǔn)確和智能的決策支持,還通過PPO算法與LLM相結(jié)合,通過學(xué)習(xí)海量的文本數(shù)據(jù)來生成文本,實(shí)現(xiàn)自我學(xué)習(xí)和訓(xùn)練的能力,更好地應(yīng)對(duì)不確定性,從而生成適應(yīng)各種情況的調(diào)度策略,本系統(tǒng)自動(dòng)根據(jù)數(shù)據(jù)生成的決策方案,輔助人工判斷,為工作人員提供決策建議,本系統(tǒng)通過大型語言模型(LLM)結(jié)合智能優(yōu)化算法,設(shè)計(jì)并訓(xùn)練出專門應(yīng)用于軌道交通領(lǐng)域的決策輔助系統(tǒng),以優(yōu)化地鐵車站人員調(diào)度決策。
    附圖說明
    [0031]圖1為本專利技術(shù)提出的基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng)的系統(tǒng)框圖。
    具體實(shí)施方式
    [0032]下面將結(jié)合本專利技術(shù)實(shí)施例中的附圖,對(duì)本專利技術(shù)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例僅僅是本專利技術(shù)一部分實(shí)施例,而不是全部的實(shí)施例。
    [0033]在本專利技術(shù)的描述中,需要理解的是,術(shù)語“中心本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】

    【技術(shù)特征摘要】
    1.基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng),其特征在于,包括數(shù)據(jù)收集單元、人員調(diào)度優(yōu)化單元、PPO智能體、本地LLM語言模型和決策方案文本輸出單元;所述數(shù)據(jù)收集單元用于收集地鐵車站歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理,所述數(shù)據(jù)收集單元將處理后的數(shù)據(jù)分別傳輸至人員調(diào)度優(yōu)化單元和PPO智能體;所述PPO智能體接收數(shù)據(jù)收集單元傳輸?shù)臍v史數(shù)據(jù),通過PPO算法學(xué)習(xí)歷史方案產(chǎn)生類似場(chǎng)景的數(shù)據(jù)并開始自我訓(xùn)練生成新的數(shù)據(jù),所述智能體將生成的新數(shù)據(jù)傳輸至人員調(diào)度優(yōu)化單元內(nèi);所述人員調(diào)度優(yōu)化單元接收數(shù)據(jù)收集單元傳輸?shù)臍v史數(shù)據(jù)和PPO智能體生成的新數(shù)據(jù),所述人員調(diào)度優(yōu)化單元通過人員調(diào)度優(yōu)化算法根據(jù)歷史數(shù)據(jù)和新數(shù)據(jù)生成決策方案,并將決策方案?jìng)鬏斨帘镜豅LM語言模型內(nèi);所述本地LLM語言模型接收人員調(diào)度優(yōu)化單元傳輸?shù)臎Q策方案,所述本地LLM語言模型通過強(qiáng)大的自然語言處理能力和語境理解能力將決策方案重新理解和生成為自然語言文本,并將其傳輸至決策方案文本輸出單元;所述決策方案文本輸出單元接收本地LLM語言模型傳輸?shù)淖匀徽Z言文本并將其展示給工作人員查看。2.根據(jù)權(quán)利要求1所述的基于自學(xué)習(xí)大語言模型的城軌車站資源調(diào)度決策輔助系統(tǒng),其特征在于,所述數(shù)據(jù)收集單元中的歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)包括乘客流量和列車運(yùn)行...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:張婷李超揚(yáng)陳菁菁卜柿瑜黃甲鳴
    申請(qǐng)(專利權(quán))人:深圳技術(shù)大學(xué)
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产自无码视频在线观看| 亚洲AV无码成人精品区日韩 | 亚洲性无码av在线| 色窝窝无码一区二区三区成人网站| 亚洲AV无码精品色午夜在线观看| 中文字幕亚洲精品无码| 国产在线无码一区二区三区视频| 亚洲成av人无码亚洲成av人| 国产成人无码久久久精品一| 无码国模国产在线观看| 无码任你躁久久久久久老妇App | 亚洲AV无码专区在线播放中文| 亚洲av无码一区二区三区人妖| 亚洲av中文无码乱人伦在线播放 | 特级无码a级毛片特黄| 亚洲av永久无码精品天堂久久| 日韩精品无码人成视频手机 | 无码日韩人妻精品久久| 亚洲国产成人精品无码区在线秒播 | 国产成人亚洲综合无码| 极品无码国模国产在线观看| 人妻丰满熟妇无码区免费| 国产精品一区二区久久精品无码| 久久久久亚洲AV无码去区首| 精品成在人线AV无码免费看| 无码人妻丰满熟妇区五十路百度| 国产成年无码AV片在线韩国| 精品人体无码一区二区三区 | 亚洲熟妇无码八V在线播放| 亚洲精品无码Av人在线观看国产| 久久无码AV中文出轨人妻| 日韩精品无码免费视频| 国产免费午夜a无码v视频| 午夜寂寞视频无码专区| 国产成人精品无码专区| 日韩视频无码日韩视频又2021| 国产免费午夜a无码v视频| 国产精品成人无码久久久久久| 亚洲Av无码国产情品久久| 全免费a级毛片免费看无码| 无码日韩人妻AV一区二区三区|