3月1日,DeepSeek“开源周”的最后一天,DeepSeek抛出最后一枚“王炸”——首次披露成本利润率关键信息。
DeepSeek在社交媒体的官方账号上称:“假定GPU租赁成本为2美金/小时,总成本为 87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为 562,027,成本利润率545%。”
当然,这只是最理想的情况。
图源:图虫创意
而现实是,DeepSeek开源周让行业振奋。这些开源工具不仅让全球AI开发者能更高效、更低成本地进行AI模型的开发和训练,也让多年来关于大模型开源和闭源的“口水仗”,在这一阶段有了初步结论。
2月,过去坚定的“闭源派”百度(9888.HK)宣布将开源下一代文心大模型,之后,字节豆包、昆仑万维等均推出开源模型,阿里巴巴(9988.HK)也进一步深化开源。
“或主动、或被动,开源(大模型)已经被带动起来了。”开源大模型社区OpenCSG联合创始人、CTO王伟向时代财经感慨。
DeepSeek正在撼动当前AI大模型的市场格局。有行业人士表示,大模型仍然保持超高速迭代的态势,“过时的”模型几乎无人问津。“在大模型领域,想利用短期的算法技术优势或商业模式来打造形成长期的竞争壁垒,目前看来是不可能的。”该业内人士称。
DeepSeek给开发者们带来福音的同时,也让一些大模型公司可能不得不“赶鸭子上架”,“跟风”开源。
但开源之后呢?
DeepSeek可以测算自己的理论利润率,但其他厂商是否找到盈利模式?
开闭源战局扭转
继模型、论文开源之后,DeepSeek正向着更底层的开源进发。
“DeepSeek开源周开源的这些技术,能够大大提高推理效率,同样场景和服务规模下,所需GPU数量更少。往大了说,这甚至能达到节能减排的效果。”王伟称,以DeepSeek开源项目中涉及到的EP(Expert Parallelism,专家并行)技术为例,过去除了少数头部公司有能力实现,多数企业是享受不到EP加速的,只能以较低的效率进行推理。
“但DeepSeek开源后,这一情况有望很快得到改善。开源成果将会被其他通用开源项目、企业、科研组织等快速吸收,地融入到他们的项目之中。”王伟表示。
例如,摩尔线程就在3月1日晚上宣布在短时间内成功实现对 DeepSeek 各个开源项目的全面支持,涵盖 FlashMLA、DeepEP、DeepGEMM、DualPipe 以及 Fire-Flyer 文件系统(3FS)。
“当然,这套技术方案还存在一些限制,例如它主要还是针对英伟达的技术架构,特别是Hopper架构的显卡,以及针对MOE这类架构模型的训练和推理等。”王伟补充道。
在LangGPT社区创始人云中江树看来,DeepSeek的开放程度直接将大模型应用的门槛基本拉平了。“它足够开放,没有任何限制,现在甚至把部署的底层代码都开放出来,相当于手把手地教大家如何高效部署了。”
据云中江树介绍,目前全球主要有meta Llama系列模型、阿里千问系列和DeepSeek三个重要的AI开源玩家。开源则涉及到模型的权重、训练代码和训练数据三个层面。
从模型权重来看,这是每个开源玩家都会选择开放的基本要求,而训练代码和训练数据则几乎没有一家可以完全开放。
差异主要体现在开源协议上,DeepSeek在开源协议上对商用几乎没有任何限制。从开源的广度来看,也几乎只有DeepSeek能将集群计算、通信等提升能效的代码开放出来。并且在开源可复现性上,DeepSeek公开了更多训练细节及核心思想,目前社区已有 OpenR1 项目实现完全复制。
图源:图虫创意
更重要的是,DeepSeek完全扭转了关于大模型开闭源的战局。
时代财经从多名业内人士处了解到,过去一段时间海外大模型开源势头有所减弱,硅谷的AI巨头逐步转向闭源。王伟提到,美国科技巨头们为了商业化目标,纷纷选择闭源作为自身的发展模式,而DeepSeek、Qwen等中国模型则成了开源的重要力量。
此前,业内人士认为开源可能是“伪命题”,比如李彦宏就曾表示,“开源模式是一种智商税。”但如今百度也走到了自己的反面,2025年的2月14日,百度官方微信发布公告,“我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。”用短短一句话宣布放弃坚持了两年的闭源之路。
“赶鸭子上架”?
DeepSeek的技术实力匹配开放程度,一时让开源成为大模型的主流。
不只百度,多家大模型企业在2月推出开源模型或进一步深化开源。2月10日,字节跳动豆包大模型团队联合北京交通大学等开发的视频生成实验模型“VideoWorld”正式开源;2月18日,昆仑万维开源了其旗下面向AI短剧创作的视频生成模型SkyReels-V1和表情动作可控算法SkyReels-A;2月23日,月之暗面Kimi宣布开源大模型Moonlight。
另外一家大模型厂商阿里云则是一直开源和闭源两条腿走路的。2月25日,阿里通义千问推出QwQ-Max-Preview深度思考模型,支持联网搜索,并计划后续开源。当日深夜,阿里云视觉生成基座模型万相2.1(Wan)开源了14B和1.3B两个参数规格的全部推理代码和权重,同时支持文生视频和图生视频任务,本地消费级GPU即可部署。
图源:图虫创意
顶着DeepSeek的风暴,厂商们选择开源背后的动力,是创新,是跟风,还是“赶鸭子上架”?
在近期百度财报电话会议上,百度创始人兼CEO李彦宏解释了促使百度做出这一艰难抉择背后的原因。
李彦宏称,“开源最好的模型可以极大地促进采用”,并希望通过开源让开发者和用户认识到文心系列大模型的真正价值。
“促进采用”的背后,可能蕴藏着更深层的生态战位。
王伟表示,DeepSeek一系列模型开源之后,国内外从芯片到Infra框架,再到应用层,几乎都快速去做适配。这股风潮甚至超过了之前meta开源的Llama模型。
据时代财经此前报道,单是芯片厂商,截至2月中旬就有超过15家紧急适配了DeepSeek系列模型,包括华为昇腾、壁仞科技、昆仑芯、沐曦、云天励飞(688343.SH)、摩尔线程等厂商,并且更深入的适配工作仍在进行中。
王伟进一步解释,当一个新架构的模型推向市场时,会面临在芯片、框架和应用等软硬件生态适配问题,需要投入人力去攻克。这个周期较长,很多时候没有生态工具来助力,最后,往往是厂商花费大量资金解决这个问题,最终由用户来买单。
如今,DeepSeek则通过强大的模型能力和有效的开源策略快速跨过了适配难关。其他模型厂商如果仍坚持商业化全闭源策略,那么除了API接入外,私有化部署的生态适配会维持在高成本状态,这会大大削弱这些厂商的竞争力。
“如同Llama开源后催生了一批基于Llama的生态项目,目前整个AI生态都在与DeepSeek兼容。甚至,尽管DeepSeek还处于发展中,估计过一两年,它可能就会成为AI领域的‘安卓系统’。”云中江树同样认为,开源是融入进大模型生态中最好的办法。
如果企业自己开发一套闭源的、较小的系统,而其他厂商不与之兼容,软件也无法适配,那么自然而然地,其他厂商和用户都不会选择这样的系统,甚至可能会面临被淘汰的风险。
因此,主动也好,“赶鸭子上架”也好,开源成为大模型厂商不得不考虑的选项。
另外,从融资的角度看,一家风险投资机构负责人告诉时代财经,能不能选择开源一定是接下来投大模型一个非常重要的指标。
“不是说开源就领先闭源,而是你可以闭源,但是开源可能会在更短的周期内追上你,那么你的竞争优势还在不在模型本身,或者说竞争优势还能不能持续这件事,是需要大家更多去考量的。”上述负责人表示。
一名业内人士对时代财经坦言:“一个残酷的事实是: DeepSeek开源了,原来的大模型坚持的闭源私有化商业模式就不成立了。”
开源之后呢?
闭源的商业模式受到冲击,但是对于开源大模型如何实现商业化也是很多企业的的未解难题。
在上述风险投资机构负责人看来,DeepSeek的商业化路径并没有非常清晰。“这也是开源一直存在的问题,过往在软件行业通过开源获得巨大成功的公司在美国有出现过,在国内确实尚未看到相关案例。”更何况,从DeepSeek 的创始人梁文锋的对外表态来看,他是一位技术理想主义者,而非为了盈利目的。
不过,云中江树也指出,在目前大模型的发展阶段,即使是闭源,其商业化本身也并不理想,如OpenAI、Grok等头部模型的盈利能力也不强。底层的原因是,当前大模型的智能化水平尚未达到真正商业化落地的要求。
DeepSeek在《DeepSeek-V3 / R1 推理系统概览》中指出,由于DeepSeek-V3定价低于R1,且网页端和应用程序免费,仅部分服务产生收入,再加上非高峰时段设有夜间折扣,其实际收入不及理论数值。
图源:DeepSeek官方账号
“其他公司想快速做到(像DeepSeek)这么好,并不容易。”据王伟透露,几家知名的DeepSeek R1 API供应商的利润率远不如DeepSeek自己。但在此次开源周之后,这个情况有望改善。
王伟认为,短期内, DeepSeek的开源会让模型厂商面临很大的压力,大量的研发投入也可能会被质疑。但长期来看,大模型的竞争远没有结束,各模型厂商如果能适当吸收DeepSeek的开源成果,拿出更竞争力的模型,未来是有可能反超的。长期看好中国的大模型企业,国内有多家基础模型厂商具备与DeepSeek相当的实力。
“开源也有其独特的商业模式。”云中江树表示,一种是免费提供模型,但出售相关服务来盈利,比如帮助企业需要将模型部署到自己的公司,进行性能调优、本地部署、专项能力提升等;其次是实行双轨制,即开源和闭源并行,一些基础的或较小的模型开源以吸引人气,而高级版、较大规模的模型则闭源出售;还有一种策略如埃隆·马斯克旗下的xAI公司,它的策略是开源上一代Grok模型,而最新一代模型则采用闭源等。
“不过,无论是哪一种商业模式,目前没有商业化诉求的DeepSeek可能还是一个很大的变量和异数。”云中江树说。
(时代财经庞宇对此文亦有贡献)
(责任编辑:王治强 HF013)