当前位置:首页 > 人工智能 > 大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化
 

大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化

来源:戴金权    时间:2024/11/29

《大模型专题:大模型的异构计算和加速》由英特尔院士戴金权在AiCon人工智能开发与应用大会上的演讲内容整理而成。报告介绍了大语言模型的异构计算和加速相关技术。先阐述大语言模型基于Transformer解码器架构的自回归模型原理。接着分析大模型推理和训练面临的瓶颈,包括内存带宽、计算、显存大小和分布式计算等方面。

报告重点介绍了大模型的异构计算和加速方法。包括XPU异构计算,涉及CPU、GPU、NPU等硬件加速;低比特计算,如模型量化/压缩、数据类型选择、低比特算子应用以及对显存使用量和训练微调的影响,并对比了不同量化方式下多个模型的精度;还介绍了推理算法优化,涵盖Self - speculative decoding、KV Cache compression等多种方式。

此外,报告还介绍了IPEX - LLM开源大模型XPU加速框架及其应用场景,如在Intel Core Ultra AI PC、Intel Arc A770 GPU等不同硬件上的加速体验,包括Office助手、工业机器人代码生成、AI座舱 - 汽车助理等多个应用案例展示了英特尔XPU在大模型应用创新方面的成果,并鼓励关注和试用IPEX - LLM,在Intel XPU平台开发大模型及其应用。


附件:大模型的异构计算和加速:加速方法,包括XPU异构计算,多个模型的精度,推理算法优化



 
 
 
相关推荐
» 2024年人本智能:人机共生时代的科技发展观报告,人机关系推向了新发展阶段,加速了人工智能在全行业的应用普及
» 中国AI大模型产业发展驱动力:政策因素
» 2025具身智能行业发展研究报告具身智能技术发展与行业应用简析,机器人的能力向商用服务、家庭服务等更开放的场景进行延伸
» 2025年十大AI技术趋势-原生统一多模态、具身智能、AI for Science
» 2025年五大趋势:人智共创未来+点燃创新纪元-重塑AI蓝图的重大趋势,AI产品和服务创新与业务模式变革
» 2025年技术趋势-构建一个更加个性化和定制化的AI生态系统
» AI产业全景洞察报告2025-未来十年年均增长率达19.1%,覆盖超51亿用户
» 2025年中国AIoT产业全景图谱报告-产业的发展现状、技术趋势、应用场景以及主要企业情况
» 2025大小模型端云协同赋能人机交互报告-协同的关键技术,应用场景及优势,挑战与展望
» 2025年人工智能典型企业招聘趋势分析报告-规模接近6000亿,企业4500家,年增长率为 15.6%
» 生成式人工智能与高等教育变革:价值影响及未来发展2025-教学模式向师-生-机三元结构深度交互,与人机协同打造超级教师
» 生成AI在高等教育中的应用:当前的做法和前进的道路-五个行动领域是规则,访问权限,熟悉度,信任和文化
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号

扫码关注微信公众号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728