内容简介:信息平权 路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研究员Daya在2月初已经说过:RL还在早期,今年会看“显著进步”(significant progress) 其实在r1论文中也提到过:由于目前RL训练数据还很少,R1的下个版本会大幅提升。 也就是r1论文中...
用户评论
热门文章