27

2025/10

Google DeepMind：从开源模型中提取 SFT 和 RL 训练数据

当前，大型语言模型（LLM）领域的一个共识是，模型的卓越能力不仅源于其庞大的参数规模和海量的预训练数据，更在很大程度上依赖于高质量的“对齐”数据。这些数据，通 ...

20 小时前

15 0