|
|
当前位置:首页 > 人工智能应用 > DeepSeek原理与落地应用,基于上下文预测下一个 token,激发深度思考等,提升对话质量 |
DeepSeek原理与落地应用,基于上下文预测下一个 token,激发深度思考等,提升对话质量 |
来源:北京大学 时间:2025/3/7 |
人工智能概念辨析:介绍大模型相关术语,回顾大模型从运算推理、知识工程到深度学习的发展历程,对比生成模型和推理模型在定位、推理能力、多模态支持、应用场景和用户交互体验的差异。 DeepSeek R1 公司与模型:DeepSeek 成立于 2023 年 7 月,获幻方量化支持,专注大语言模型开发。旗下模型包括生成模型 V3 和推理模型 R1,R1 具有推理能力强、开源、低成本、国产化等特点,在国际竞争中处于梯队。 使用与部署:提供官方网页、APP、API,还可通过超算平台等第三方渠道使用。个人可通过 Ollama 部署蒸馏模型,企业可利用 vLLM 进行生产J部署。部署 R1 满血版需特定算力支持,不同算力配置价格不同。 模型原理:GPT 采用 Transformer 架构,经预训练、监督微调等阶段,基于上下文预测下一个 token。生成模型有语言理解和生成等能力,但存在幻觉等问题。DeepSeek R1 通过思维链、强化学习和蒸馏技术,提升推理能力,减少模型大小。 落地应用 提示词技巧:包括真诚直接、使用通用公式、说人话、反向 PUA、善于模仿、擅长锐评、激发深度思考等,可提升对话质量。 应用场景:适用于推理密集型任务、教育与知识应用、文档分析、开放L域问答写作等场景。在教育与学术L域,可用于教学设计、作业批改、论文辅助等;在知识付费L域,可进行课程大纲设计、直播脚本撰写等。
![]() |
相关推荐 |
»
DeepSeek:智能时代的全面到来和人机协作的新常态,可能带来4天工作制等变革
» DeepSeek大模型及其企业应用实践(企业篇),在客户服务,个性化推荐等多场景有应用 » DeepSeek大模型概念,技术与应用实践,使用DeepSeek处理文档,图片类AIGC的应用包括图像生成、图像修复、图像增强和图像识别等方面 » Deepseek1小时快速入门教程(适合零基础小白),涵盖其功能特性、使用方法、技巧策略、问题应对及资源拓展等内容 » DeepSeek 7天指导手册(从入门到精通),涵盖基础操作、多场景应用、提升学习能力等内容 » DeepSeek中小学生使用手册,提问的十大原则,个性化阅读推荐 » 详解DeepSeek:模型训练,优化及数据处理的技术精髓,采用MLA多层注意力架构,推理速度提升3倍 » DeepSeek从入门到精通干货 7大场景+50大案例+全套提示词,在日常生活、家庭教育、职场工作、创业经营、自媒体创作等多个场景中发挥重要作用 » 2025DeepSeek爆火详细报告,低价与免费策略,技术创新,智能体爆发 » 我们该如何看待DeepSeek_what_how_why and next,AI变为全民生产力,推动社会生产效率变革 » 面向工程审计行业的DeepSeek大模型应用指南V1,核心应用场景,应用建议 » 实用DeepSeek赋能家庭教育,在各学科学习中的应用,在情感教育与亲子沟通中的应用 |
![]() ![]() ![]() |
![]() |
|
|
版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |