- DeepSeek发布的R1模型在性能上与OpenAI的模型相当,同时大幅降低了使用成本,推动AI应用的快速发展。
- 该模型的创新架构和优化技术将刺激推理算力需求,尤其是国产芯片厂商将受益于此。
- 投资者应关注头部AI应用厂商、国产算力芯片厂商及AI服务器厂商等相关领域的机会。
核心要点2DeepSeek于1月20日发布了DeepSeekR1模型,该模型在数学、代码和自然语言推理等任务上的性能与OpenAI的模型相当,并已在多个平台上线。
DeepSeek同时开源了660B的DeepSeekR1Zero和DeepSeekR1模型,并蒸馏出6个小模型,部分小模型的性能达到OpenAI的mini版本。
DeepSeekR1模型的优化主要体现在四个方面:1) 强化学习,降低数据标注成本并提升自我学习能力;2) MoE架构,细化专家粒度,提升模型性能;3) 多token预测(MTP),提高模型效率;4) PTX编程,进行更细粒度的优化。
DeepSeek还支持FP8精度训练和多头潜在注意力机制。
由于模型性能提升和调用成本下降,AI应用的开发有望加速。
DeepSeek的使用成本显著低于OpenAI的模型,吸引了包括百度、腾讯、微软和亚马逊在内的大型云服务提供商接入DeepSeek模型。
DeepSeekAPP上线20天内日活跃用户突破2000万,成为全球增长最快的AI应用。
在算力需求方面,DeepSeek将推动推理算力需求的增长,国产芯片厂商将受益。
尽管DeepSeek的训练成本相对较低,但仍将刺激中小型大模型厂商的研发投入。
投资建议包括关注头部AI应用厂商、国产算力芯片厂商、AI服务器厂商、算力云服务商和端侧硬件厂商。
风险提示包括AI产品落地不及预期、行业竞争加剧和技术研发进展不及预期。
投资标的及推荐理由投资标的及推荐理由: 1. 各领域的头部AI应用厂商: - 推荐理由:DeepSeek在降低使用成本的同时保持高性能,有望加速AI应用的发展。
2. 国产算力芯片厂商: - 推荐理由:随着DeepSeek的推广,推理算力需求将快速增长,国产芯片厂商将充分受益。
3. AI服务器厂商: - 推荐理由:AI应用的快速发展将推动对AI服务器的需求,相关厂商有望获得市场份额。
4. 算力云厂商: - 推荐理由:DeepSeek模型的接入将促进云服务的使用,算力云厂商将受益于AI应用的增长。
5. 端侧硬件厂商: - 推荐理由:DeepSeek的小模型将加快模型在端侧场景的落地,相关硬件厂商将迎来新的市场机会。
风险提示:需关注AI产品落地不及预期、行业竞争加剧及技术研发进展不及预期的风险。