AI 【新芒xAI】李飞飞团队50美元复刻DeepSeek R1:基于阿里云Qwen模型监督微调而成

【新芒xAI】李飞飞团队50美元复刻DeepSeek R1:基于阿里云Qwen模型监督微调而成

新芒x 2月7日消息 今日有报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。

该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

《科创板日报》记者调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。

文章来源信息声明: 本文信息出自权威媒体、企业官方及网络,并经新芒X编辑,转载请注明源出处、作者和链接。 图片部分来源于网络,在此表示感谢,如有侵权请联系我方处理。 文章发布日期后方火形图标后的数字,为文章热度,谨代表受欢迎程度。 新芒X平台仅对用户提供信息及决策参考,本文不构成投资建议。

作者: 新芒Group

新芒出品,专注专业。兼具内容品质和传播影响力
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部