中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈

  DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。本篇报告我们通过分析DeepSeek V3和R1模型论文,理解其核心逻辑是“按需分配算力,最小化冗余计算”,使得千亿级模型在低成本硬件(甚至边缘设备)上高效运行成为可能,为大规模商业化落地提供了技术基础。我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:建议核心关注晶圆代工、国产算力芯片、定制化存储、终端品牌、SoC五大方向。

  ▍DeepSeek如何实现的训练成本降低?

  1)架构创新: DeepSeek-V3的基础架构中采用了DeepSeekMoE专家架构和MLA多头潜在注意力机制,DeepSeekMoE通过细粒度专家分配、共享专家及无辅助损失负载均衡策略优化传统MoE,提升计算资源效率;MLA通过低秩联合压缩减少注意力键值缓存占用,提升计算效率、减少内存消耗。

  2)FP8混合精度训练:在全球主流大模型中率先采用FP8低精度数据进行大规模训练,大部分核心计算用FP8提升速度、降低内存用量,部分关键操作保留高精度确保动态稳定性。

  3)训练工程优化:DeepSeek在主流大模型中率先采用硬盘充当输入端缓存,设计DualPipe算法实现高效流水线并行,融合前后向通信阶段,减少阻塞;采用定制化高效跨节点all-to-all通信内核降低通信开销;通过重计算、EMA、共享向量和输出头减少内存占用。

  4)数据策略优化:应用多token预测机制MTP,增加训练信号密度,减少20%训练迭代次数,帮助模型捕捉长距离依赖关系。

  ▍DeepSeek如何实现的推理成本降低?

  DeepSeek-V3对推理的预填充和解码两个阶段都优化了专家使用效率:预填充阶段MoE用EP32及冗余专家策略提升效率,解码阶段探索动态路由减少通信开销;还通过支持FP8、INT8量化和提供蒸馏版本,实现低精度量化与模型压缩,减少显存占用。DeepSeek的开源生态可以更好支持硬件厂商适配,例如可以对MLA算子优化提升推理效率,DeepSeek-R1发布后国内外芯片厂商快速响应支持DeepSeek。1月25日,AMD宣布已将新的DeepSeek-V3集成到Instinct MI300X GPU上并经过SGLang对推理过程进行了优化,英伟达、英特尔也随后在1月31日官宣支持。国内厂商都已经官宣完成对DeepSeek的适配,国产算力成为相对稳定可靠的选项,支撑国产大模型从研发走向商业化。

  ▍从DeepSeek算力需求看AI芯片设计方向?

  DeepSeek 在论文的芯片设计意见指导中指出通信和计算同等重要,计算方面降低精度和内存需求是关键。在通信硬件优化上,DeepSeek建议开发独立通信协处理器,实现计算与通信物理分离,同时建议融合网络架构,统一IB和 NVLink的网络协议栈,统一通信接口以简化编程复杂度和降低通信延迟;在计算硬件优化上,建议提升 FP8 计算精度,并支持分块量化与在线量化,减少访存开销,提升推理效率。我们认为DeepSeek建议带来两点启示:

  1)“推理速度”基本90%是由decoding阶段决定的,因此内存容量决定大模型推理速度,我们认为内存升级仍是算力芯片升级的重点方向,看好近存计算发展。

  2)我们认为在模型开源的策略下,DeepSeek-R1蒸馏后的小模型性能有望持续快速提升,帮助端侧硬件加速接入,助力AI应用全面落地。我们看好品牌商和SoC芯片厂商的成长机遇。

  ▍风险因素:

  算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期;相关产业政策出台力度不及预期;AI技术及应用发展不及预期;芯片技术迭代不及预期;国产先进制程量产进展不及预期;行业竞争加剧等。

  ▍投资策略:

  我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:

  1)云端:DeepSeek有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长。

  2)终端:我们看好DeepSeek带来模型轻量化的全面升级,端侧硬件接入有望加速爆发,助力AI应用全面落地,建议关注品牌厂商,SoC芯片厂商。

本文来自作者[admin]投稿,不代表百科商品立场,如若转载,请注明出处:http://xn--g2xx48ccpa940a.com/bm/202502_5665.html

(17)

文章推荐

  • 博时基金王祥:黄金整体维持强势,美联储鸽派发声提振金价

      黄金市场当周(1月13日-17日)整体维持强势,美联储鸽派发声提振金价表现。国内投资者行为分化,场内继续维持流入但场外投资者存在一定兑现意愿。  市场观点方面,过去一周(1.13~1.17),黄金市场延续高位震荡态势,整体依然呈现强势。当周支撑力量回归到传统逻辑,由于周内公布的美国通胀数据优于

    2025年01月20日
    16
  • 中注协:禁止以或有收费方式 提供审计服务

      证券时报记者贺觉渊  近日,为顺应经济社会发展对注册会计师诚信执业和独立性的更高要求,进一步提升审计质量,中国注册会计师协会(以下简称“中注协”)起草《中国注册会计师独立性准则第1号——财务报表审计和审阅业务对独立性的要求》(以下简称《独立性准则》),经财政部批准印发。《独立性准则》明确禁止

    2025年01月21日
    17
  • 金蝶国际终止2015年股份奖励计划及采纳2025年股份奖励计划

      金蝶国际(00268)发布公告,鉴于2015年股份奖励计划将于2025年12月期满,为继续不时向获选参与者授予奖励股份以示鼓励,董事会欣然宣布,其已于2025年1月21日批准采纳2025年股份奖励计划,以即时取代及终止2015年股份奖励计划。

    2025年01月26日
    15
  • 拉卡拉与环汇达成战略合作提供一整套支付解决方案_环刷和拉卡拉哪个好

    本文目录一览:1、拉卡拉和汇付天下哪个费率低2、拉卡拉有跨境支付业务吗3、拉卡拉打造一条龙服务平台,有望吃下跨境电商这波红利4、移动支付平台有哪些?拉卡拉和汇付天下哪个费率低建设、交通、中国银行的卡,刷借记卡时,手续费费率为0.5%,20元封顶;刷信用卡时,手续费费率为0.

    2025年02月10日
    15
  • HTFX:ONGC计划投资115亿美元加速清洁能源转型

    2月14日,HTFX表示,印度国有石油天然气公司(ONGC),作为该国最大的石油和天然气生产商,计划在2030年前投资高达115亿美元(约1万亿印度卢比)以推动其清洁能源战略。ONGC目前约占印度70%的石油和天然气生产量。该公司财务董事维韦克·昌德拉坎特·通高卡在接受彭博社采访时透露,ONGC

    2025年02月16日
    15
  • 服装店做好抖音的关键是什么?_抖音服装店怎么运营

    本文目录一览:1、抖音上做服装的怎么做2、实体店服装生意怎么做?3、服装店如何精准引流获客?抖音上做服装的怎么做1、服装在抖音上做直播怎么做:直播前:进行主播人设打造:主播的人设是进行直播的第一步,“倾家荡产李佳琦”、“薇娅的女人”、“每次吃到饭店老板崩溃的浪味仙”等,这些说法背

    2025年02月22日
    13
  • 中国财险:已全额赎回80亿元资本补充债券

      3月24日金融一线消息,中国财险发布公告,有关公司完成在全国银行间债券市场公开发行10年期80亿元人民币资本补充债券(“该资本补充债券”)。正如此前公告所载,公司于该资本补充债券的第五年末具有赎回权。公司已行使上述赎回权,全额赎回了该资本补充债券。

    2025年03月25日
    8
  • 美国前财长萨默斯:当霸凌者退缩,看到美国(这样),真是可悲

      来源:华尔街见闻  萨默斯还表示:我们远未摆脱困境,信誉已经丧失殆尽,要心存畏惧。

    2025年04月10日
    4
  • 布局硬核科技,为什么科创100更有锐度?

    登录新浪财经APP搜索【信披】查看更多考评等级  内容来源:我是基民  从ChatGPT的问世掀起全球AI风暴,到DeepSeek以低廉成本实现GPT-4级性能;从波士顿动力机器人在工厂的精准协作,到宇树人形机器人在春晚舞台的惊艳亮相,全球科技产业正经历着前所未有的范式革命。  在AI产业化

    2025年04月10日
    4
  • IMF预计关税不确定性将迫使日本央行推迟加息

    专题:聚焦2025年IMF和世行春季年会  国际货币基金组织(IMF)一位高级官员周三表示,由于美国关税引发的不确定性加大了经济增长和通胀的下行风险,日本央行可能推迟进一步加息的时间。  国际货币基金组织亚太部副主任、驻日本使团团长NadaChoueiri表示,围绕美国关税和其他国家反应的巨大

    2025年04月24日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年02月15日

    我是百科商品的签约作者“admin”!

  • admin
    admin 2025年02月15日

    希望本篇文章《中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地》能对你有所帮助!

  • admin
    admin 2025年02月15日

    本站[百科商品]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年02月15日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

    联系我们

    邮件:百科商品@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们