19
2025/10
告别“炼丹”,拥抱“工程”:Meta AI 万字长文详解大模型强化学习的 Scaling Law
我们对如何有效规模化(scale)RL 的理解却远远没有跟上步伐。与已经建立起成熟、可预测的规模化法则(Scaling Laws)的预训练阶段不同,LLM 的
...