本站2月9日消息,飞腾官方宣布,飞腾腾云S5000C、飞腾腾锐D3000处理器已成功实现对DeepSeek全系列大模型的端到端支持,覆盖数据中心和终端场景,而且性能非常出色。
其实在2024年,DeepSeek-V2.5 236B大模型就已经在飞腾腾云S5000C平台成功稳定运行。
DeepSeek-V3、R1版本发布后,飞腾第一时间在腾云S5000C、腾锐D3000平台上本地部署验证,形成整体解决方案,构建端到端的国产平台DeepSeek大模型智算环境。
在数据中心侧,腾云S5000C服务器可以与多款AI加速卡配合,实现DeepSeek蒸馏版和全量版的部署。
根据官方实测,飞腾腾云S5000C搭配8块国产的AI加速卡,蒸馏版DeepSeek-R1-Distill-Llama-70B版本的推理速度可达到每秒22个tokens,本地部署的推理效率与国外同类产品架构解决方案相当,整体性能相当于国外平台性能的80%左右。
同时,完整版DeepSeek R1 671B模型采用分布式推理框架,基于四机、32卡AI服务器集群,也已部署成功。
在用户终端侧,基于腾锐D3000、银河麒麟V10系统的台式机,可以本地部署DeepSeek-R1 7B蒸馏版模型,再搭配1张国产推理卡,就实现了AI PC能力,能够建立安全可靠的本地知识助手。
现阶段,飞腾平台已实现端到端支持DeepSeek全系列、众多开源和国产头部大模型的本地化部署,可为企业级和个人应用提供全国产化、软硬一体、性价比高、安全、开放的全栈解决方案。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com