教師データを使った AlphaGo が使わない AlphaGoZero…
jrf> 教師データを使った AlphaGo が使わない AlphaGoZero になったみたいな衝撃が LLM に来るとすれば、強化学習による探索の強化というよりも、言語情報に依存しないマルチモーダルという形で起きるのではないか。つまり、言語データも視覚データの一部として蓄積してるだけ…みたいな。感覚データのみから LLM 的学習を行っていく感じ。
jrf> 教師データを使った AlphaGo が使わない AlphaGoZero になったみたいな衝撃が LLM に来るとすれば、強化学習による探索の強化というよりも、言語情報に依存しないマルチモーダルという形で起きるのではないか。つまり、言語データも視覚データの一部として蓄積してるだけ…みたいな。感覚データのみから LLM 的学習を行っていく感じ。