DeepSeek's Large Model Shakes Up the Global AI Community!

DeepSeek大模型的震动全球AI圈!

近日,DeepSeek宣布正式发布最新人工智能模型DeepSeek-R1,并开源模型权重。DeepSeek-R1在后期训练阶段大量运用强化学习技术,以最少的标注数据大幅提升模型的推理能力。

DeepSeek-R1 在数学、编码、自然语言推理等任务上的表现,与 OpenAI 的 o1 正式版旗鼓相当。数据显示,DeepSeek-R1 在算法编码场景(Codeforces)和知识型测试(GPQA、MMLU)中的得分略低于 OpenAI o1,但在工程编码场景(SWE-Bench Verified)和美国数学竞赛(AIME 2024、MATH)中,DeepSeek-R1 的表现优于 OpenAI o1。

另外,值得注意的是,DeepSeek-R1 API 服务价格为每百万输入 token 1 元(cache hit)/4 元(cache miss),每百万输出 token 16 元,输出 API 价格仅为 OpenAI o1 的 3%。低价背后仍是实力的体现,定价权体现了技术实力——在 AI 基础设施层面降低成本的能力。

返回博客

发表评论