種別	[gsm] 2023-07-03T00:03:23Z
セクション	グローバル共有メモ
日時	2023-07-03T00:03:23Z
元URL	(URLなし)

bard_maze を作る前に PAR (Predictor Actor…

jrf> bard_maze を作る前に PAR (Predictor Actor Recollector) モデルを考えていた。最初は迷路ゲームを解くのも PAR モデルで作ることを考えていたのだが、PAR モデルは前にいらずもっと簡単なモデルでできるのに気づいた経験から、もっと簡単に迷路ゲームを解くことを考えて、bard_maze となった。

しかし、bard_maze の考え方はうまくいかず、Bard の学習に期待せず無理やり解かせる方向に実験の目的が移ってきた。ここで逆に以前のように Recollector を決め打ちするような感じで方針の与え方は知っているものとして、Predictor と Actor を「few-shot learning」で学習させるのに意味があるのではと考え始めている。