「熊剣迷路問題」bardapi を使った実験。1.7…
jrf> 「熊剣迷路問題」bardapi を使った実験。1.7 は、コマンド認識の際に、これまでは可能な行動の中から、回答案のうち表現がより適切なものを選んでいたが、それを回答案のうちより方針に沿ったものが選ばれるようにした。結果1日で 51手目でゴールできた。 《bard_maze_1.7.ipynb》 https://gist.github.com/JRF-2018/c4e9a994393f1c0273cde91b9219df9e なお、これまでのところで有利に迷路を解かせる手段はだいたい尽きたのではないか。今後は、プログラムを簡単にしたり、不利にしたりして、実験していくことになるだろう。 本当なら、そのように条件をかえることで、迷路を解かせる速さが変わるという以上に、Bard の学習への効果がどうなるかに興味があるのだが、それは無料で使う一ユーザーには試せることではないように思う。