TMT行业:DeepSeek R1发布,大模型格局预计发生重大变化
2025年1月,国内人工智能初创公司DeepSeek正式发布最新开源模型DeepSeek-R1,在全球范围引发广泛关注与讨论。目前行业普遍认为DeepSeek带来了两个里程碑性质的意义:1.算力成本投入表现出来的性能超出行业认知,用于训练的成本可能大大降低;2.开源路线对大公司闭源路线的底层颠覆。
技术性能卓越DeepSeek-R1采用MIT许可证开源,允许用户通过蒸馏技术训练其他模型。它的创新性体现在后训练阶段大规模应用强化学习技术,在标注数据极少的情况下,仍显著提升了模型推理能力。在数学、代码和自然语言推理等任务中,DeepSeek-R1性能比肩OpenAI o1正式版,在一些第三方测试中表现优异,如在美国加州大学伯克利分校研究人员设立的聊天机器人竞技场(chatbotarena)平台上,DeepSeek-R1的性能表现位列前十。
成本优势显著,性价比极高在成本方面,DeepSeek-R1有着无可比拟的优势。此前发布的DeepSeek-V3仅使用2048颗英伟达H800GPU,就完成了6710亿参数模型的训练,成本约为560万美元,远低于其他顶级模型的训练成本。而DeepSeek-R1在运行成本上同样突出,输入费用仅为0.55美元/百万tokens(缓存未命中),缓存命中时更是低至0.14美元/百万tokens,输出费用仅为2.19美元/百万tokens。相比之下仅为OpenAIGPT-4o输入费用同等情况下的,这使得DeepSeek-R1未来可能成为预算敏感企业和团队的首选。
开源模式引领DeepSeek-R1的开源发布在国际AI社区激起千层浪。Meta首席AI科学家Yann LeCun表示,其成功证明了开源模型正超越闭源模型。与OpenAI限制对其系统的访问以维护竞争优势不同,DeepSeek允许全球企业和开发者共同开发和改进技术。这种开源策略为开发者提供了更多自由和灵活性,开发者能根据自身需求对模型进行调整和优化,极大地促进了技术社区的交流与创新。
突破外部限制,彰显创新力量近年来,美国在芯片等领域对中国实施出口限制,试图打压中国AI发展。但DeepSeek依然构建出匹敌美国顶尖科技公司的AI模型。OpenAI前高管扎克卡斯直言,美国的限制未能阻止DeepSeek的进步,资源限制反而激发了中国科研人员的创造力。DeepSeek-R1的发布让怀疑论者重新评估中国的技术发展,也让美国决策者反思通过设置障碍确保领先地位的方法是否可行。
推荐标的逻辑:AI部署成本降低+运行成本降低,带动AI应用与云服务厂商需求落增加,建议关注:AI应用落地:美图公司1357.HK、汇量科技1860.HK、第四范式6682.HK;基础设施:金山云3896.HK、万国数据9698.HK
风险提示:地缘政治风险、技术迭代带来需求和供给变化风险等。