24
2025/11
HuggingFace 高分论文:首个达到 IPhO 金牌水平的开源模型是如何炼成的?
论文标题:P1: Mastering Physics Olympiads with Reinforcement Learning
论文链接:http
...