27
2025/11

主打自验证数学推理:DeepSeekMath-V2 技术报告解读

DeepSeekMath-V2发布了,主打可自验证的数学推理。 论文标题:DeepSeekMath-V2: Towards Self-Verifiabl ...

Anthropic 新作:利用“接种提示”可以阻止 Reward Hacking 引发的非对齐泛化

论文标题:NATURAL EMERGENT MISALIGNMENT FROM REWARD HACKING IN PRODUCTION RL 论文 ...