当前位置:首页 > 人工智能标准 > 大模型专题一:中国人工智能系列白皮书——大模型技术-2023版
 

大模型专题一:中国人工智能系列白皮书——大模型技术-2023版

来源:中国人工智能学会    时间:2023/12/9

语言大模型由于在大规模通用L域数据预训练通常缺乏对特定任务或L域的知识,因此需要适配微调。微调可以帮助模型更好地适应特定需求,如对敏感数据(如医疗记录)的处理,同时不暴露原始数据。此外,微调可以提G部署效率、减少计算资源需求。指令微调和参数G效学习是适配微调的关键技术。

指令微调(Instruction Tuning)[21],是一种可以帮助语言大模型实现人类语言指令遵循的能力,在零样本设置中泛化到未见任务上的学习方法。指令微调学习形式与多任务提示微调相似,但与提示微调让提示适应语言大模型并且让下游任务对齐预训练任务不同,其是让语言大模型对齐理解人类指令并按照指令要求完成任务,即在给定指令提示的情况下给出特定的回应,其中提示可以选择性包含一条解释任务的指令。指令微调研究涉及指令理解、指令数据获取和指令对齐等内容。

(1)指令理解,指语言大模型准确理解人类语言指令的能力,是语言大模型执行指令完成任务的前提。为了增强对指令的理解,许多工作采用多任务提示方式对基于指令描述的大量任务集上对语言大模型进行微调,如FLAN[50]、InstructGPT[21]等,这些模型在未见的任务上显示出优越的零样本性能。

(2)指令数据获取,指如何构建包含多样性的任务指令数据。指令数据构建常见有三种方式:i)基于公开人工标注数据构建,代表指令数据集包括1616种不同任务的Super-Natural Instruction[51]、2000种不同NLP任务的OPT-IML[52]。ii)借助语言大模型的自动生成构建,如Unnatural Instructions[53],通过种子指令作为提示让语言大模型生成新的指令描述和问题,然后再输入到模型让其输出回答。iii)基于人工标注方法,如ChatGPT在人工标注指令的基础上通 过GPT-3、InstructGPT等在线平台收集用户真实指令数据。




附件:大模型专题一:人工智能系列白皮书——大模型技术-2023版



 
 
 
相关推荐
» 中国人工智能系列白皮书--智能协同控制与人工智能 探索多智能体系统中的协同与合作
» 心智计算:构建脑与心智启发的人工智能,介绍六种心智计算的理论模型
» 人工智能知识产权法律问题研究报告(2023年)-探索人工智能知识产权平衡的治理理念
» 北京市人工智能行业大模型创新应用白皮书-六大领域四个维度18应用案例个
» 北京市人工智能大模型行业应用分析报告-案例180场景15
» 中国人工智能产业创新版图:“极化”和“扩散”-中国新一代人工智能科技产业发展报告
» 人工智能全球治理上海宣言-促进人工智能发展
» 数据智能白皮书2024-数据与智能间的发展关系
» 脑机接口技术发展与应用研究报告2023-神经外科手术机器人
» 2024中国AI Agent市场研究报告-确定高价值场景、制定落地路径、项目可行性和供应商选型等挑战
» 信息技术 大数据 大数据服务能力评估 第1部分:评估模型 由9个部分构成
» 国家人工智能产业综合标准化体系建设指南2024:标准50项以上,,超过1000家企业
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728