10
2025/08

腾讯 AI Lab提出R-Zero「实现零数据自进化」

最近的大语言模型(LLM)发展得很快,但是,这些个模型有个问题:就是它们太依赖大量人工标注的高质量数据了。 要训练一个顶尖的LLM,需要投入很多人力、财力和时 ...

CompassVerifier 深度解析:为大模型打造统一、鲁棒的“裁判”与“奖励”系统

我们该如何准确、可靠地评估大模型的能力? 如果说模型是“工匠”,那么评估体系就是“度量衡”。一个没有精准度量衡的领域,是无法实现系统性、科学化进步的。目前,对 ...