種別[gsm] 2025-06-14T17:14:05Z
セクショングローバル共有メモ
日時2025-06-14T17:14:05Z
元URL(URLなし)

RLRMDiffusion。やるとしたら、フルにモデルを生成するのではなく、制御…

jrf> RLRMDiffusion。やるとしたら、フルにモデルを生成するのではなく、制御レイヤーの層の一部を生成する LoRA みたいなものが必要だろうと思っていた。そこに Sakana AI が Text-To-LoRA というイメージ生成についての「メタ」的な技術を発表した。この方向が今後来るように思う。

《Sakana AI:X:2025-06-12》  
https://x.com/SakanaAILabs/status/1932972420522230214
>We’re excited to introduce Text-to-LoRA: a Hypernetwork that generates task-specific LLM adapters (LoRAs) based on a text description of the task. Catch our presentation at #ICML2025!

Paper: https://arxiv.org/abs/2506.06105
Code: https://github.com/SakanaAI/Text-to-Lora[cocolog:95459644](2025年5月)
http://jrf.cocolog-nifty.com/statuses/2025/05/post-05b95f.html
>AIコンセプト妄想。RLRMDiffusion … Reinforcement Learning Result Model Diffusion。LLM を使ったロボット制御で下部メカの「どう学習すればいいかのプログラム」をプロンプトとして制御のための行列的なものを生成する…。

(…)

もちろん、RLRMDiffusion と DiffusionTransformer は違うのだが、RLRMDiffusion に似たところを目指して現状の技術で現実的なところを探るとああなった…というのが私の解釈。
<