種別	[gsm] 2025-07-05T05:18:35Z
セクション	グローバル共有メモ
日時	2025-07-05T05:18:35Z
元URL	(URLなし)

LangChain で熊剣迷路問題 Ver. 0.0.3。…

jrf> LangChain で熊剣迷路問題 Ver. 0.0.3。

《langchain_maze_0.0.3.ipynb - GitHub Gist》  
https://gist.github.com/JRF-2018/2a3fdae8f848c13754eaf85c64fbefcc

前回(0.0.1で)、気になっていたこととして、１回の invoke に対し、1度だけ command して欲しいのに、AgentExecutor にはそのようなことをするオプションがないらしいことでした。また agent_scratchpad はあるものの、行動結果に関して memory がうまく機能しそうにないことも気になっていました。

そこで command については、tool として提供するのではなく invoke の Final Answer として受け取るように変えてみました。このようにすれば、invoke のときの行動データが自然に memory にたまるようになるはずです。

あと CoT (Chain of Thought) が有効なことが多いと聞きますが、gemini flash は CoT してるという噂ですが、とにかく、行動コマンドしか出力しないと何を考えているかわからないので express_thought というツールを作り、プロンプトで考えを吐露するように促すこともやってみました。

さらに、かなり迷ってしまうので、可能な行動を明示するようにもしました。

そうやって、またたまたまゴールできたので、それを公開しておくことにしました。