種別[gsm] 2025-10-27T02:35:39Z
セクショングローバル共有メモ
日時2025-10-27T02:35:39Z
元URL(URLなし)

jrf:> ロボットの VLA…

jrf> jrf:> ロボットの VLA だと上層・指示層はメモリ機能中心で、下層・部分行動層はプレプロンプト学習中心という感じですかね。下層はそれも重いかな?

上層・下層のある VLA にしろ end-to-end でモーターコマンドを直接出力するものにしろ、環境の整った工場とかだとメモリ機能は不要かもしれませんが、農作業とかだとメモリ機能は必要でしょうね。マルチモーダルなメモリ機能が。

Grok:>下層でプレプロンプトが「重い」か? 実際には逆で、プレプロンプトの単純さ(言語/グラフベース)が学習コストを低く抑え、重い計算を避けられます。VLAの調査では、下層はDiffusionベースやRLベースの軽量モジュールが多く、プレプロンプトでパラメータ効率を高めています。 例えば、Trade-off in VLAでは、モデル圧縮や革新的アーキテクチャで下層の推論速度を向上させ、プレプロンプトが重荷にならないよう設計されています。 これにより、ロボットのリアルタイム制御が可能になります。<