04

2025/11

NVIDIA 提出 CoDeC：通过 In-Context Learning 来区分模型“记忆”还是“泛化”

对于大模型的评估来说，benchmark 必须是模型在训练阶段从未见过的。如果模型在训练中已经接触过、甚至“背诵”了测试集的内容，那么其在评测中的高分就失去了 ...

5 月前

1,377 2