《「二足歩行の腕振りを目指す強化学習の実験」を行った。以前に模倣学習したデータを…
jrf> 《「二足歩行の腕振りを目指す強化学習の実験」を行った。以前に模倣学習したデータを有効活用して「ちゃんとした歩行」を強化学習させようとしたが、Humanoid-v5 の「足先がない(足先が球体)」という物理的限界にはばまれ、実験はおおむね失敗した。 - JRF のひとこと》 http://jrf.cocolog-nifty.com/statuses/2026/03/post-87cfd1.html
jrf> 《「二足歩行の腕振りを目指す強化学習の実験」を行った。以前に模倣学習したデータを有効活用して「ちゃんとした歩行」を強化学習させようとしたが、Humanoid-v5 の「足先がない(足先が球体)」という物理的限界にはばまれ、実験はおおむね失敗した。 - JRF のひとこと》 http://jrf.cocolog-nifty.com/statuses/2026/03/post-87cfd1.html