机器学习POD 机器学习POD
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化
  • 力扣出题频次

17
2025/09

大模型

Meta AI 新研究:基于结果的探索,共同提升pass@1和pass@k,缓解大模型推理中的多样性坍塌

对于具有客观、可验证答案的推理任务(verifiable reasoning tasks),例如完成数学证明、生成一段功能代码或解决科学问题,其核心目标是找到 ...
4 小时前
7 0

专题展示

Meta AI 新研究:基于结果的探索,共同提升pass@1和pass@k,缓解大模型推理中的多样性坍塌
4 小时前
字节 Seed 提出 REER:由 Query 和 Answer 逆向得到 CoT,专注于开放式任务
1 天前
HuggingFace 月度 Top 1 论文:Gensyn AI 提出 SAPO——通过集体经验共享实现高效的语言模型后训练
2 天前
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化
  • 力扣出题频次
Copyright © 2017-2025 机器学习POD. 京公网安备11010802044892号 京ICP备2021031854号
  • 机器学习基础
  • 强化学习基础
  • 大模型
  • 其它
  • 大模型可视化
  • 力扣出题频次