机器学习POD 机器学习POD
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化

25
2025/12

大模型

Who is Adam? 重新审视大模型 RLVR 阶段的优化器选择

博客标题:Who is Adam? SGD Might Be All We Need For RLVR In LLMs 博客链接:https://w ...
15 小时前
15 0

专题展示

Who is Adam? 重新审视大模型 RLVR 阶段的优化器选择
15 小时前
代码大模型的 Scaling Laws:编程语言差异性与多语言混合策略研究
2 天前
从 0.5B 到 72B:揭秘 RL Post-Training 中的计算、数据与模型规模权衡
3 天前
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化
Copyright © 2017-2025 机器学习POD. 京公网安备11010802044892号 京ICP备2021031854号
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化