机器学习基础
强化学习基础
大模型
其它
大模型可视化
08
2024/10
大模型SFT经验
本文转载自https://zhuanlan.zhihu.com/p/809229182,作者ybq。 这篇文章介绍一下大模型的 sft 如何去做。相比较于上一篇文章介绍的 pretrain ,sft ...
大模型预训练经验
本文转载自https://zhuanlan.zhihu.com/p/718354385,作者ybq。 这篇文章介绍下如何从零到一进行 pretrain 工作。 类似的文章应该有很多,不同的地方 ...
加载更多
专题展示
Qwen 发布 ArenaRL:解决开放域 Agent 的奖励建模难题
17 小时前
NTU & 通义提出 AgentOCR:基于光学自压缩的智能体历史重构
2 天前
DroPE:通过在预训练后移除位置编码扩展 LLM 上下文窗口
4 天前
机器学习基础
强化学习基础
大模型
其它
大模型可视化