当前位置:首页 > 人工智能应用 > DeepSeek带来的AI变革,在低精度FP8的模式下训练大模型,计算成本降低约1000倍
 

DeepSeek带来的AI变革,在低精度FP8的模式下训练大模型,计算成本降低约1000倍

来源:华福证券    时间:2025/3/6

一、用户量:海外加速出圈,迅速登D下载榜单

1、网页端:重度用户为主,DeepSeek 在 24 年 12 月 26 日推出V3(对标 GPT4o),因其显著的性能,用户迅速开始增长,同时在 1月 20 日发布 R1(对标 GPT-o1)后,进一步出圈。

2、APP 端:大众用户为主,R1 推出后,追平 GPT-o1,迅速出圈海外。根据点点数据,从 DeepSeek 在美国下载排名从 1 月 22 日的 201名,迅速在 1 月 27 日登D名;根据七麦数据,截止 1 月 30 日,DeepSeek 在 168 个位居下载榜名。

二、DeepSeek 偏好激进性创新:架构(MOE+MLA)+精度(FP8)

1、MOE 架构创新:相比过去主流模型的 MOE 专家模型停留在8~16 个,而 DeepSeek 每个 MoE 层包含 1 个共享专家和 256 个路由专家,有助于降低模型推理时激活的参数量。

2、MLA 架构创新:MLA 通过联合压缩键值矩阵为低秩向量,将多个头的键值信息融合,使推理时仅需缓存少量低秩向量,大幅降低 KV 缓存需求,减少内存占用。

3、训练特色:突破大模型训练固定思维(一般模型权重和梯度使用 FP16,优化器参数使用 FP32),敢于尝试在低精度 FP8 的模式下训练大模型,并且该尝试同样出现了较好的效果。

三、DeepSeek 开源对 AI 应用和 AI 终端的影响:产品力竞争时代

DeepSeek 从 V3 到 R1,将进一步推动全行业大模型的提升,更快的追赶 GPT4o 和 GPT-o1;同时成本的下降,有助于 AI 应用和 AI 终端的普及。未来行业竞争将进入“产品能力竞争”,巨头的流量优势将进一步凸显。

四、DeepSeek 对推理成本的影响:用户规模和使用频次

未来推动推理成本增加的核心因素:用户规模和用户使用频次的增加。根据 Grok 创始人,过去 60 年,每10年计算成本降低约1000倍,但人们的购买量增加了 10 万倍,总支出反而增长了 100 倍。




附件:DeepSeek带来的AI变革,在低精度FP8的模式下训练大模型,计算成本降低约1000倍



 
 
 
相关推荐
» deepseek大模型生态报告,AI供应链格局将被重塑,基础模型层商品化,为应用开发者带来新机遇
» DeepSeek私有化部署和一体机,低成本部署,Unsloth R1动态量化部署的三种实现路径
» DeepSeek原理与落地应用,基于上下文预测下一个 token,激发深度思考等,提升对话质量
» DeepSeek:智能时代的全面到来和人机协作的新常态,可能带来4天工作制等变革
» DeepSeek大模型及其企业应用实践(企业篇),在客户服务,个性化推荐等多场景有应用
» DeepSeek大模型概念,技术与应用实践,使用DeepSeek处理文档,图片类AIGC的应用包括图像生成、‌图像修复、‌图像增强和图像识别等方面
» Deepseek1小时快速入门教程(适合零基础小白),涵盖其功能特性、使用方法、技巧策略、问题应对及资源拓展等内容
» DeepSeek 7天指导手册(从入门到精通),涵盖基础操作、多场景应用、提升学习能力等内容
» DeepSeek中小学生使用手册,提问的十大原则,个性化阅读推荐
» 详解DeepSeek:模型训练,优化及数据处理的技术精髓,采用MLA多层注意力架构,推理速度提升3倍
» DeepSeek从入门到精通干货 7大场景+50大案例+全套提示词,在日常生活、家庭教育、职场工作、创业经营、自媒体创作等多个场景中发挥重要作用
» 2025DeepSeek爆火详细报告,低价与免费策略,技术创新,智能体爆发
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号

扫码关注微信公众号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728