首页
产品系列
行业应用
渠道合作
新闻中心
研究院
投资者关系
技术支持
关于创泽
| En
 
  当前位置:首页 > 新闻资讯 > 人工智能应用 > deepseek大模型生态报告,AI供应链格局将被重塑,基础模型层商品化,为应用开发者带来新机遇  
 

deepseek大模型生态报告,AI供应链格局将被重塑,基础模型层商品化,为应用开发者带来新机遇

来源:赛迪智库电子信息研究所      编辑:创泽      时间:2025/3/6      主题:其他   [加盟]

DeepSeek 对大的启示,还是“开放”二字。无论是 心态上还是方法上,都要毫不动摇地坚持开放,继续开放。 DeepSeek 的胜利,就是开源打败闭源。OpenAI 以前是开源 的,后来变成闭源的,这次 DeepSeek 爆火之后,OpenAI 的 奥特曼也出来说话,承认闭源是一种战略错误。

本周围绕 DeepSeek 的热议,让许多人清 晰地看到了几个一直存在的重要趋势:美国在 GenAIL域的L先地位正在被迎头赶上,AI 供应链格局将被重塑;开放权重模型正在推动基础模型层商品化,为应用开发者带来新机遇 ;扩大规模并非通往 AI 进步的途径。尽管算力 备受追捧,但算法创新正在快速降低训练成本。

“DeepSeek 可能会开辟一个全新的由引L的技术 生态系统,这会让的开发者因 DeepSeek 开发的低成本、 更G效的人工智能产品而受益。”一位 TMT L域投资人如是 说,“这种竞争从某种程度来说也将打破美国科技巨头的市 场主导地位。

大模型训练降低成本主要靠两招:压缩、并行和提升硬 件使用效率。DeepSeek-V3 这次所用的方法基本上就是猛挥 这三板斧。

1. 压缩:从结构到量化

压缩很容易理解,就是把大的东西压缩成小的。对于模 型训练来讲,压缩之后,运算单元(GPU 和 CPU)需要进行 的运算数据量就会减少,运算速率必然会提升。另一个重要 影响是,内存占用和缓存会减少,这样训练同样大小的模型 所需要的硬件规模也可以大幅减少。

2. 并行:对硬件的J限使用

要实现更快的训练速度,有效的方法就是增加并行计 算的规模,让更多的计算单元同时处理不同的数据或任务。 而在并行中,需要解决的问题就是尽可能的有效利用计算资 源,让它们都G负载的工作。

DeepSeek-V3 这回真的可以说是在训练工程上无所不用 其J。总结下来,重要的包括以下这么几个方面。

DeepSeek-V3 的横空出世,用一组的数据出色诠释了没 有 GPU Poor,只有卷得不够多。当 o1、Claude、Gemini 和 Llama 3 等模型还在为数亿美元的训练成本苦恼时, DeepSeek-V3 用 557.6 万美元的预算,在 2048 个 H800 GPU集群上仅花费 3.7 天/万亿 tokens 的训练时间,就达到了足以 与它们比肩的性能。这意味着每万亿 tokens 仅需 180K 个 H800 GPU 小时,总计 278 万 GPU 小时的训练成本。而 Llama 3.1 的训练使用了 16,384 块 Nvidia H100 GPU,总计 2100 多 万 GPU 小时,翻了十倍。通过 671B 的总参数量,在每个 token 激活 37B 参数的准确控制下,DeepSeek-V3 用 14.8 万 亿G质量多样化 token,构建出了一个能够超越所有开源模 型,直逼 GPT-4 和 Claude-3.5 的 AI 巨人。


附件:deepseek大模型生态报告,AI供应链格局将被重塑,基础模型层商品化,为应用开发者带来新机遇






DeepSeek带来的AI变革,在低精度FP8的模式下训练大模型,计算成本降低约1000倍

突破大模型训练固定思维,敢于尝试在低精度 FP8 的模式下训练大模型,出现了较好的效果,每10年计算成本降低约1000倍,但人们的购买量增加了 10 万倍

DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地

DeepSeek大模型的开源,低成本和高性能将大幅降低大模型的获得,部署和应用成本,将加快大模型在 B 端和 C 端应用场景的落地;已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景,应用领域广阔

从DeepSeek看国内AI产业趋势,部署大模型的成本下降,应用有望大规模落地

DeepSeek 降低了单个模型的部署成本,AI 应用有望大规模落地, 推理算力需求将显著增长,相关厂商有望加速进入业绩兑现期,在 AI 应用前沿落地 场景中,全球 AI 应用产业有望迎来共振期

DeepSeek推进技术平权,赋能AI图像应用深耕细作,输入费用 0.55/百万 token

PI 调用层面,DS/OpenAI 的输入费用分别为 0.55/15 美元/百万 token,DS 推理使用成本仅为 OpenAI 的 4%,显著的降低资金门槛,推动了 AI 技术平权

DeepSeek行业级应用白皮书,精准数据洞察与自动化效能提升方法论

精准数据洞察与自动化效能提升方法论;DeepSeek将在企业服务、科研创新等垂直领域深度渗透;DeepSeek将通过开源战略扩大开发者社区规模,并推出模型微调平台和低代码部署工具

周鸿祎清华授课:DeepSeek带来的创业机会

周鸿祎以DeepSeek带来的变革为切入点,深入剖析AI行业发展趋势,并分享了AI技术于创业的应用前景,未来应用将从六大方向实现爆发,企业内部未来一定是多个大模型组合工作

AIGC发展研究3.0版,聚焦于DeepSeek以外的世界

AI生成的回答重复相似,缺乏新意,即使改变提问,无法提供不同的结论;使用更多样的训练数据和算法,提高AI的多样性;优化训练参数, 避免模型陷入局部最优

DeepSeek与AI幻觉,普通用户难以辨别AI内容的真实性,对医疗建议、法律咨询等专业场景的可靠性产生怀疑

模型难以处理训练集外的复杂场景,模型过度依赖参数化记忆,普通用户难以辨别AI内容的真实性,可能对医疗建议、法律咨询等专业场景的可 靠性产生长期怀疑

DeepSeek+DeepResearch:让科研像聊天一样简单,垂直领域深耕,流程自动化与认知协作

DeepSeek技术突破与应用场景,冷启动数据与多阶段优化,本地部署与端云协同,垂直领域深耕(医疗、金融、教育);智能协作与自动化转型,消费决策与商业研究赋能

DeepSeek赋能职场(清华大学2),从提示语技巧到多场景应用

你想要生成什么样的文案? 这样的文案具备哪些特征? 你要针对什么生成类似文案? 篇幅、用词、结构优化;批量生成新媒体文案

DeepSeek从入门到精通(清华大学1),采用SPECTRA模型进行任务分解

提示语(Prompt)是用户输入给AI系统的指令或信息,包括指令、上下文和期望,为了更有效地进行任务分解,可以采用SPECTRA模型,能够扫描读取各类文件及图片中的文字内容

DeepSeek提示词工程和落地场景,使用DeepSeek的三种方法,提示词让对话质量提升立竿见影

讲座为DeepSeek原理和应用系列研讨的讲座之一,聚焦提示词工程与产业实践两大核心模块,延续前序对AIGC底层逻辑的探讨,系统拆解如何通过自然语言交互充分释放DeepSeek潜能
 
资料获取
新闻资讯
== 资讯 ==
» 四足机器人场景应用发展蓝皮书-市场约70
» 迎宾机器人的位置传感器:电位器、光电编码
» 人形机器人上岗餐饮酒店服务场景(如迎宾、
» 智能清洁机器人在商业综合体清洁场景,。模
» 中国人工智能系列白皮书—-具身智能(20
» 腰部外骨骼机器人,20kg的攀登与行走助
» 室内安防巡检机器人的数据中心巡检场景:多
» 光伏机器人清洁太阳能板的七大优点:独有性
» 2025上海智能机器人百大场景案例集-重
» 具身大模型:人形机器人智慧内核,主流框架
» 具身智能数据行业研究白皮书2026-数据
» 2025上海市“AI+制造”发展白皮书,
» Hermes橙皮书《Hermes Age
» 清华大学《OpenClaw在企业办公中的
» 基于多机器人协作的关键问题:有限带宽和地
 
== 机器人推荐 ==
 
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人底盘

机器人底盘

 

商用机器人  Disinfection Robot   展厅机器人  智能垃圾站  轮式机器人底盘  迎宾机器人  移动机器人底盘  讲解机器人  紫外线消毒机器人  大屏机器人  雾化消毒机器人  服务机器人底盘  智能送餐机器人  雾化消毒机  机器人OEM代工厂  消毒机器人排名  智能配送机器人  图书馆机器人  导引机器人  移动消毒机器人  导诊机器人  迎宾接待机器人  前台机器人  导览机器人  酒店送物机器人  云迹科技润机器人  云迹酒店机器人  智能导诊机器人 
版权所有 © 创泽智能机器人集团股份有限公司     中国运营中心:北京·清华科技园九号楼5层     中国生产中心:山东日照太原路71号
销售1:4006-935-088    销售2:4006-937-088   客服电话: 4008-128-728