19

2025/10

告别“炼丹”，拥抱“工程”：Meta AI 万字长文详解大模型强化学习的 Scaling Law

我们对如何有效规模化（scale）RL 的理解却远远没有跟上步伐。与已经建立起成熟、可预测的规模化法则（Scaling Laws）的预训练阶段不同，LLM 的 ...

1 天前

16 0