27
2025/10

Google DeepMind:从开源模型中提取 SFT 和 RL 训练数据

当前,大型语言模型(LLM)领域的一个共识是,模型的卓越能力不仅源于其庞大的参数规模和海量的预训练数据,更在很大程度上依赖于高质量的“对齐”数据。这些数据,通 ...