机器学习基础
强化学习基础
大模型
其它
大模型可视化
首页
›
其它
›
Leetcode 出题频率 [4014 道题]
Leetcode 出题频率 [4014 道题]
0xC001
10 月前
支持标签、难度、频率筛选,文档链接放在公众号底部菜单啦~
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
2
763
复制链接
新浪微博
微信
0xC001
分享机器学习知识
蒙特卡洛法近似KL散度的艺术:从有偏估计到零方差优化
上一篇
Diffusion:真正的王牌不是“快”,而是“超级数据学习者”
下一篇
猜你喜欢
Diffusion:真正的王牌不是“快”,而是“超级数据学习者”
蒙特卡洛法近似KL散度的艺术:从有偏估计到零方差优化
Ripro V5主题增加推广用户送会员
Self-Attention中Dot-Product为什么要Scale(为什么要除以根号d)
随机文章
Meta AI 提出基于 RL 的连续 CoT 训练新范式
8 月前
周志华团队新作:通过IRL挖掘LLM内生奖励,首次理论证明RL对LLM有效性
9 月前
一个轻量但不失高效的SFT训练框架:OpenSFT
1 年前
清华&美团首次揭秘MoE:从“Massive Activations”到“Attention Sink”,探寻“超级专家”的机制
10 月前
Qwen团队提出CHORD训练流程:动态融合 SFT 与 RL
9 月前
2026 年 5 月
一
二
三
四
五
六
日
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
« 4 月
机器学习基础
强化学习基础
大模型
其它
大模型可视化