種別[gsm] 2025-08-17T13:45:41Z
セクショングローバル共有メモ
日時2025-08-17T13:45:41Z
元URL(URLなし)

(承前) 先の [P1,P2,P3,P4] の例で P3 と P4…

jrf> (承前)

先の [P1,P2,P3,P4] の例で P3 と P4 がモジュール的だとする。このとき [P1,P2,P4,P3] に置き換えたり [P1,P2,P3,P4] を [P1,P2,P4] にするようなことが追加負担があまりないように、LLM を訓練したり、先のキャッシュをニューラルネット的に修正する手法を使ったりしてできるのかもしれない。そういう道はあるのかもしれない。

そう ChatGPT さんに述べたところ….

ChatGPT:> あります。しかも “外部ツールだけ” に寄らず、訓練/キャッシュ操作/プロンプト設計を組み合わせると、P3・P4の入替えや省略を“ほぼタダ”に近づける道筋が見えます。要点だけ箇条書きでまとめます。

(…)

短いSFT(順序/省略データ拡張)+ 相対位置のKV再ベース + モジュールPrefix/Adapter + 階層キャッシュのスケジューリングを組み合わせれば、P3・P4を入替え・省略しても破綻しない“モジュール型プロンプト”が実用域に入ります。

内部キャッシュを“ニューラルに修正”する部分は、RoPE位相の再ベースや圧縮KVの学習がその役割を担い、メゾ的な記憶運用にちょうどハマります。
<

…とのこと。