27
2025/11
主打自验证数学推理:DeepSeekMath-V2 技术报告解读
DeepSeekMath-V2发布了,主打可自验证的数学推理。
论文标题:DeepSeekMath-V2: Towards Self-Verifiabl
...
Anthropic 新作:利用“接种提示”可以阻止 Reward Hacking 引发的非对齐泛化
论文标题:NATURAL EMERGENT MISALIGNMENT FROM REWARD HACKING IN PRODUCTION RL
论文
...