|
|
当前位置:首页 > 人工智能应用 > DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地 |
DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地 |
来源:平安证券 时间:2025/3/6 |
DeepSeek-V3 和 DeepSeek-R1 陆续发布,国产大模型能力已可比肩海 外L军大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式发布 DeepSeek-V3 大模型版本并同步开源。根据 DeepSeek 网 站信息,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界 D的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方 面,根据 DeepSeek 发布的技术文档论文信息,DeepSeek-V3 的训练时 长为 2788K 个 H800 GPU 小时,训练花费约为 557.6 万美元。2025 年 1 月 20 日,DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1,性能对 齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性 能已可比肩海外L军大模型,且成本更低。 DeepSeek 系列大模型引发广泛关注,海内外巨头科技公司及云服务 平台厂商已相继接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春节期间,DeepSeek 系列大模型火爆出圈,引 发广泛关注。根据新浪财经 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 个市场中成为下载量多的移动应用。根据 Appfigures 的 数据,DeepSeek 的推理人工智能聊天机器人在 1 月 26 日登上苹果公司 App Store 的榜,并自那时以来一直保持的位置。同时, 也开始了对 DeepSeek 大模型的复刻。以港科大团队为例,港科大助理教 授 何 俊 贤的 团 队, 只 用了 8K 个 样 本, 就 在 7B 模型 上 复刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的训练。当前,海内外巨头科技公 司及云服务平台厂商已相继接入了 DeepSeek 大模型,部分 AI 应用L域 相关企业也已开始了 DeepSeek 大模型的部署和应用。DeepSeek 大模型 获得了的广泛关注,认可度持续提升。我们认为,DeepSeek大模型的开源、低成本和G性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在 B 端和 C 端应用场景的落地。另外,DeepSeek 大模型的出 圈将对大模型产业的竞争格局产生重要影响,将对海外L军大模型厂 商的L先性产生冲击,并同时将对算力的未来发展产生重要影响。 DeepSeek 大模型的出圈预计不改算力整体需求向上的态势,但推理和端 侧算力有望增长更快。DeepSeek 在算法效率和计算成本方面有着较大的 优势,短期内可能对训练算力的增长有一定的平抑效应,但是不改 AI 算 力整体需求长期上升的态势。AI 作为智能化发展的主要抓手,大模型 当前已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景,应用L域广阔。DeepSeek 低成本而且开源的解决方 案,大幅降低了 AI 在各行各业应用的技术和成本门槛,为 AI 的产业化落地提供了更快的路径。推理和端侧的算力需求增长潜力非常大。同时,较低训练成本以及开源的 DeepSeek,有望带来更低 的大模型开发和使用门槛,基于该大模型开发的主体可能更多,也一定程度上为训练算力需求提供了支撑。DeepSeek 并不 是压缩了算力市场,反而为算力市场增加了更多的想象空间。DeepSeek 也在积J与国产 AI 算力平台合作。DeepSeek 大模 型与国产 AI 芯片适配的逐步成熟,将加快推动国产 AI 芯片在国内大模型训练端和推理端的应用,加快国产 AI 芯片产业链的 成熟,为国产 AI 芯片产业带来发展机遇,同时加快我国大模型产业的发展。
![]() |
相关推荐 |
»
DeepSeek带来的AI变革,在低精度FP8的模式下训练大模型,计算成本降低约1000倍
» deepseek大模型生态报告,AI供应链格局将被重塑,基础模型层商品化,为应用开发者带来新机遇 » DeepSeek私有化部署和一体机,低成本部署,Unsloth R1动态量化部署的三种实现路径 » DeepSeek原理与落地应用,基于上下文预测下一个 token,激发深度思考等,提升对话质量 » DeepSeek:智能时代的全面到来和人机协作的新常态,可能带来4天工作制等变革 » DeepSeek大模型及其企业应用实践(企业篇),在客户服务,个性化推荐等多场景有应用 » DeepSeek大模型概念,技术与应用实践,使用DeepSeek处理文档,图片类AIGC的应用包括图像生成、图像修复、图像增强和图像识别等方面 » Deepseek1小时快速入门教程(适合零基础小白),涵盖其功能特性、使用方法、技巧策略、问题应对及资源拓展等内容 » DeepSeek 7天指导手册(从入门到精通),涵盖基础操作、多场景应用、提升学习能力等内容 » DeepSeek中小学生使用手册,提问的十大原则,个性化阅读推荐 » 详解DeepSeek:模型训练,优化及数据处理的技术精髓,采用MLA多层注意力架构,推理速度提升3倍 » DeepSeek从入门到精通干货 7大场景+50大案例+全套提示词,在日常生活、家庭教育、职场工作、创业经营、自媒体创作等多个场景中发挥重要作用 |
![]() ![]() ![]() |
![]() |
|
|
版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |