04

2026/06

直接蒸馏更强的教师模型不一定会带来更好的效果：重新审视 SFT 中的风格 token 与能力 token

让每一项优秀工作，被更多人看见：点击进入投稿通道论文追踪 APP 推荐：DailyPapers 论文标题：How to Fine-Tune a Re ...

3 小时前

8 1