27

2025/11

主打自验证数学推理：DeepSeekMath-V2 技术报告解读

DeepSeekMath-V2发布了，主打可自验证的数学推理。论文标题：DeepSeekMath-V2: Towards Self-Verifiabl ...

21 小时前

36 0

Anthropic 新作：利用“接种提示”可以阻止 Reward Hacking 引发的非对齐泛化

论文标题：NATURAL EMERGENT MISALIGNMENT FROM REWARD HACKING IN PRODUCTION RL 论文 ...

1 天前

22 0