机器学习基础
大模型
其它
大模型可视化
MEMORYSTILL
08
2024/10
大模型SFT经验
本文转载自https://zhuanlan.zhihu.com/p/809229182,作者ybq。 这篇文章介绍一下大模型的 sft 如何去做。相比较于上一篇文章介绍的 pretrain ,sft ...
大模型预训练经验
本文转载自https://zhuanlan.zhihu.com/p/718354385,作者ybq。 这篇文章介绍下如何从零到一进行 pretrain 工作。 类似的文章应该有很多,不同的地方 ...
加载更多
专题展示
蒙特卡洛法近似KL散度的艺术:从有偏估计到零方差优化
3 周前
大模型SFT经验
4 月前
大模型预训练经验
4 月前
机器学习基础
大模型
其它
大模型可视化
MEMORYSTILL