机器学习POD 机器学习POD
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化

24
2025/11

大模型

HuggingFace 高分论文:首个达到 IPhO 金牌水平的开源模型是如何炼成的?

论文标题:P1: Mastering Physics Olympiads with Reinforcement Learning 论文链接:http ...
24 小时前
23 0

专题展示

AllenAI OLMo 3 技术报告深度解析
7 小时前
HuggingFace 高分论文:首个达到 IPhO 金牌水平的开源模型是如何炼成的?
24 小时前
Meta 提出 SoCE 策略,仅靠权重融合实现 SOTA
2 天前
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化
Copyright © 2017-2025 机器学习POD. 京公网安备11010802044892号 京ICP备2021031854号
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化