種別[gsm] 2025-05-02T05:52:08Z
セクショングローバル共有メモ
日時2025-05-02T05:52:08Z
元URL(URLなし)

教師データを使った AlphaGo が使わない AlphaGoZero…

jrf> 教師データを使った AlphaGo が使わない AlphaGoZero になったみたいな衝撃が LLM に来るとすれば、強化学習による探索の強化というよりも、言語情報に依存しないマルチモーダルという形で起きるのではないか。つまり、言語データも視覚データの一部として蓄積してるだけ…みたいな。感覚データのみから LLM 的学習を行っていく感じ。