01

2026/02

MIT 提出 SDFT：作为逆强化学习（Inverse RL）的在线自蒸馏

论文标题：SELF-DISTILLATION ENABLES CONTINUAL LEARNING 论文链接：https://arxiv.org/p ...

2 月前

272 0