種別[gsm] 2025-09-13T13:16:50Z
セクショングローバル共有メモ
日時2025-09-13T13:16:50Z
元URL(URLなし)

私の MemoryBanditWorkflow…

jrf> 私の MemoryBanditWorkflow の枠組み(↓)。どう学習すればいいのか、専門家でないからよくわからないが、実行時の動的計画の前に、実行に入る前のメモリ・バンディット・ワークフローの「プログラミング」が必要で、そこは教師が学習させられるのではないか…という気はする。つまり、今の RAG とかを MemoryBanditWorkflow に置き換える手順というのは学習できて、それを教師データに使えるのではないか…とか予想する。

[cocolog:95619779](2025年9月)
《「LLM のメモリ機能を強制的に使うバンディットマシンの試験実装」と「LLM のメモリ機能とバンディット機能の試験実装」を行った。後者がメインの成果物で、メモリ機能の使用増加をどう強制するかから拡張したフレームワーク。 - JRF のひとこと》
http://jrf.cocolog-nifty.com/statuses/2025/09/post-8225e2.html