04
2025/11
NVIDIA 提出 CoDeC:通过 In-Context Learning 来区分模型“记忆”还是“泛化”
对于大模型的评估来说,benchmark 必须是模型在训练阶段从未见过的。如果模型在训练中已经接触过、甚至“背诵”了测试集的内容,那么其在评测中的高分就失去了
...