|
|
当前位置:首页 > 人工智能应用 > DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读,长思维链的推理提高模型的可解释性 |
DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读,长思维链的推理提高模型的可解释性 |
来源:北京大学 时间:2025/3/5 |
DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展:DeepSeek-V3 解读
未来技术方向展望: 长思维链可解释性 Takeaways
![]() |
相关推荐 |
»
DeepSeek与AIGC应用,探讨大模型和AIGC的底层工作机制,突破工具应用的局限
» DeepSeek提示词工程和落地场景,使用DeepSeek的三种方法,提示词让对话质量提升立竿见影 » DeepSeek从入门到精通(清华大学1),采用SPECTRA模型进行任务分解 » DeepSeek赋能职场(清华大学2),从提示语技巧到多场景应用 » DeepSeek+DeepResearch:让科研像聊天一样简单,垂直领域深耕,流程自动化与认知协作 » DeepSeek与AI幻觉,普通用户难以辨别AI内容的真实性,对医疗建议、法律咨询等专业场景的可靠性产生怀疑 » AIGC发展研究3.0版,聚焦于DeepSeek以外的世界 » 周鸿祎清华授课:DeepSeek带来的创业机会 » DeepSeek行业级应用白皮书,精准数据洞察与自动化效能提升方法论 » DeepSeek推进技术平权,赋能AI图像应用深耕细作,输入费用 0.55/百万 token » 从DeepSeek看国内AI产业趋势,部署大模型的成本下降,应用有望大规模落地 » DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地 |
![]() ![]() ![]() |
![]() |
|
|
版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |