近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384 超节点昇腾云服务和高性能推理框架 SiliconLLM ,用大规模专家并行最佳实践正式上线 DeepSeek-R1。
该服务在保证单用户 20 TPS 水平前提下,单卡 Decode 吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1 的模型精度与 DeepSeek 官方保持一致。
其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix 超节点集群在总算力、互联带宽、内存带宽上领先业界。
此前,硅基流动在大模型云服务平台 SiliconCloud 首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1 推理服务持续升级。
DeepSeek 风暴席卷全球,特别是以其高效、低成本的 MoE 架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek 并非易事。
DeepSeek 使用了大规模专家并行(Expert Parallelism,大 EP 并行)的 MoE 模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek 官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek 公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。
针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384 超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM 在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下, 获得 DeepSeek-R1 推理效率与资源利用率的显著提升。
硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek 推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。
推荐阅读:
-
奥尔良烤鸡翅:原来是这么做的,简单还好吃
懒人版奥尔良烤鸡翅的用料鸡翅 15只奥尔良烤料 40克水 40克懒人版奥尔良烤鸡翅的做法步骤步骤 1料和水混合,鸡翅腌制3到4个小时。我用的酷克100。步骤 2...
2020-02-12 -
世界5大名汤,中国这碗汤皇宫贵族才能享用,已
虽然世界各地的饮食文化不同,但是对于汤,东西方人都比较注重。西方文化中有巫婆熬汤,各种口味和食材都放进去,食材口味魔法大不一样。在中国,尤其是在南方,各种高汤、...
2020-02-12 -
五种街边小吃,自己在家5分钟搞定,健康还美味
街头小吃怎么做好吃,如何做街头小吃最正宗呢?这里有最常见的街头小吃的家常做法和街头小吃的做法大全图解,还有最正宗的街头小吃做法。许多人都说做菜难,其实看着步骤图...
2020-02-12 -
市场上的椰子蟹,为什么卖这么贵?做好掰开一看
随着时间的沉淀,生活条件逐渐好了起来,每一次去到超市里面逛,都是会买下非常多的食物,每一种食物都是很不错,特别的好吃呢。螃蟹是一种很常见的海鲜,当然还可以图片当...
2020-02-12 -
免烤箱!一 次成功的草莓雪媚娘~超级好吃!
免烤箱!一 次成功的草莓雪媚娘~超级好吃,无需烤箱,一次就能成功的甜品白草莓雪媚娘!薄薄的外皮,满满的馅料,一口咬下去超满足的!一起来学学吧材料:糯米粉50克、...
2020-02-12 -
教你在家做烫面葱油饼,层层起酥,越嚼越香,好
烫面葱油饼是北方很家常的一道面食,一种由面粉和小葱为主要食材的面食煎饼,也是最具中国特色的主食之一。 葱油饼有发面,死面之分,还有一种就是用烫面做的,才出锅的葱...
2020-02-12