机器学习POD 机器学习POD
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化

08
2026/05

大模型

中科院京东新作 CoPD:混合训练能力打架,先训后蒸馏吸收不了——第三条路怎么走

让每一项优秀工作,被更多人看见:点击进入投稿通道 论文追踪 APP 推荐:DailyPapers 论文标题:Co-Evolving Policy D ...
13 小时前
9 0

专题展示

中科院京东新作 CoPD:混合训练能力打架,先训后蒸馏吸收不了——第三条路怎么走
13 小时前
通义新作 TCOD:蒸馏越训越差?揭秘多轮 Agent 的"轨迹级 KL 崩溃"现象
2 天前
从 Context 到 Skills:LLM 能否高效从上下文习得技能?
3 天前
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化
Copyright © 2017-2026 机器学习POD. 京公网安备11010802044892号 京ICP备2021031854号
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化