11
2026/04

大模型后训练再思考:决定推理SFT泛化能力的三个隐藏变量

让每一项优秀工作,被更多人看见:点击进入投稿通道 论文标题:Rethinking Generalization in Reasoning SFT: A ...