29
2025/08
港科大提出DARS:在RLVR中进行深度广度协同,实现Pass@1与Pass@K性能同步提升
现有的RLVR框架在实际应用中仍面临性能提升的瓶颈,今天分享的这篇论文《DEPTH-BREADTH SYNERGY IN RLVR: UNLOCKING LL
...
InternVL3.5 Post-Training 技术解析
InternVL3.5 无论是从官方发布的结果,还是实际体验上来说都是比较有亮点的,今天着重解读一下InternVL3.5用到的后训练技术。
论文标题:
...