快科技2月9日消息,飞腾官方宣布,飞腾腾云S5000C、飞腾腾锐D3000处理器已成功实现对DeepSeek全系列大模型的端到端支持,覆盖数据中心和终端场景,而且性能非常出色。
其实在2024年,DeepSeek-V2.5 236B大模型就已经在飞腾腾云S5000C平台成功稳定运行。
DeepSeek-V3、R1版本发布后,飞腾第一时间在腾云S5000C、腾锐D3000平台上本地部署验证,形成整体解决方案,构建端到端的国产平台DeepSeek大模型智算环境。
在数据中心侧,腾云S5000C服务器可以与多款AI加速卡配合,实现DeepSeek蒸馏版和全量版的部署。
根据官方实测,飞腾腾云S5000C搭配8块国产的AI加速卡,蒸馏版DeepSeek-R1-Distill-Llama-70B版本的推理速度可达到每秒22个tokens,本地部署的推理效率与国外同类产品架构解决方案相当,整体性能相当于国外平台性能的80%左右。
同时,完整版DeepSeek R1 671B模型采用分布式推理框架,基于四机、32卡AI服务器集群,也已部署成功。
在用户终端侧,基于腾锐D3000、银河麒麟V10系统的台式机,可以本地部署DeepSeek-R1 7B蒸馏版模型,再搭配1张国产推理卡,就实现了AI PC能力,能够建立安全可靠的本地知识助手。
现阶段,飞腾平台已实现端到端支持DeepSeek全系列、众多开源和国产头部大模型的本地化部署,可为企业级和个人应用提供全国产化、软硬一体、性价比高、安全、开放的全栈解决方案。