29
2025/08

港科大提出DARS:在RLVR中进行深度广度协同,实现Pass@1与Pass@K性能同步提升

现有的RLVR框架在实际应用中仍面临性能提升的瓶颈,今天分享的这篇论文《DEPTH-BREADTH SYNERGY IN RLVR: UNLOCKING LL ...

InternVL3.5 Post-Training 技术解析

InternVL3.5 无论是从官方发布的结果,还是实际体验上来说都是比较有亮点的,今天着重解读一下InternVL3.5用到的后训练技术。 论文标题: ...