10
2025/08
腾讯 AI Lab提出R-Zero「实现零数据自进化」
最近的大语言模型(LLM)发展得很快,但是,这些个模型有个问题:就是它们太依赖大量人工标注的高质量数据了。
要训练一个顶尖的LLM,需要投入很多人力、财力和时
...
CompassVerifier 深度解析:为大模型打造统一、鲁棒的“裁判”与“奖励”系统
我们该如何准确、可靠地评估大模型的能力?
如果说模型是“工匠”,那么评估体系就是“度量衡”。一个没有精准度量衡的领域,是无法实现系统性、科学化进步的。目前,对
...