本發(fā)明提供一種基于強(qiáng)化學(xué)習(xí)的仿生水下機(jī)器人節(jié)能游動步態(tài)學(xué)習(xí)方法和裝置,涉及機(jī)器人技術(shù)領(lǐng)域,包括:模仿仿生機(jī)器魚的結(jié)構(gòu),設(shè)計構(gòu)建基于細(xì)長體理論的強(qiáng)化學(xué)習(xí)仿真環(huán)境;基于機(jī)器魚的任務(wù)目標(biāo)及運動狀態(tài)構(gòu)建馬爾可夫決策模型;基于強(qiáng)化學(xué)習(xí),學(xué)習(xí)框架的...