创泽机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 人工智能标准 > 大模型专题一:中国人工智能系列白皮书——大模型技术-2023版

大模型专题一:中国人工智能系列白皮书——大模型技术-2023版

来源:中国人工智能学会     编辑:创泽   时间:2023/12/9   主题:其他 [加盟]

语言大模型由于在大规模通用领域数据预训练通常缺乏对特定任务或领域的知识,因此需要适配微调。微调可以帮助模型更好地适应特定需求,如对敏感数据(如医疗记录)的处理,同时不暴露原始数据。此外,微调可以提高部署效率、减少计算资源需求。指令微调和参数高效学习是适配微调的关键技术。

指令微调(Instruction Tuning)[21],是一种可以帮助语言大模型实现人类语言指令遵循的能力,在零样本设置中泛化到未见任务上的学习方法。指令微调学习形式与多任务提示微调相似,但与提示微调让提示适应语言大模型并且让下游任务对齐预训练任务不同,其是让语言大模型对齐理解人类指令并按照指令要求完成任务,即在给定指令提示的情况下给出特定的回应,其中提示可以选择性包含一条解释任务的指令。指令微调研究涉及指令理解、指令数据获取和指令对齐等内容。

(1)指令理解,指语言大模型准确理解人类语言指令的能力,是语言大模型执行指令完成任务的前提。为了增强对指令的理解,许多工作采用多任务提示方式对基于指令描述的大量任务集上对语言大模型进行微调,如FLAN[50]、InstructGPT[21]等,这些模型在未见的任务上显示出优越的零样本性能。

(2)指令数据获取,指如何构建包含多样性的任务指令数据。指令数据构建常见有三种方式:i)基于公开人工标注数据构建,代表指令数据集包括1616种不同任务的Super-Natural Instruction[51]、2000种不同NLP任务的OPT-IML[52]。ii)借助语言大模型的自动生成构建,如Unnatural Instructions[53],通过种子指令作为提示让语言大模型生成新的指令描述和问题,然后再输入到模型让其输出回答。iii)基于人工标注方法,如ChatGPT在人工标注指令的基础上通 过GPT-3、InstructGPT等在线平台收集用户真实指令数据。




附件:大模型专题一:中国人工智能系列白皮书——大模型技术-2023版






中国信通院联合发布《数据清洗、去标识化、匿名化业务规程(试行)》

指导行业主体组织开展数据清洗,去标识化,匿名化处理等及相应的技术测试评估,支撑数据共享,交易,开放等流通活动合规,有序进行

深圳市地方标准《多功能智能杆系统施工技术规范》

本文件规定了多功能智能杆系统组成、总体施工要求、施工安全、基础设施施工要求、杆体安装施工要求、挂载设备施工要求、管理平台组建、系统及挂载设备调试、系统工程验收和资料移交

北京市海淀区人民政府印发《关于加快中关村科学城人工智能大模型创新发展的若干措施》的通知

海行规发〔2023〕4号;打造2300亿元核心产业规模,集聚100家大模型企业机构,以及60家国家级专精特新小巨人企业,以及新培育5-10家独角兽企业,打造四大人工智能产业园

中国首个AIGC管理办法 《生成式人工智能服务管理暂行办法》

明确了训练数据处理活动和数据标注等要求;规定了生成式人工智能服务规范,明确生成式人工智能服务提供者应当采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务

中国新一代人工智能发展战略研究院刘刚教授发布了《中国新一代人工智能科技产业发展 2023》

我国的人工智能产业集群表现为新型创新区→城市→区域→全国→全球的空间结构特征,依托狭小的物理空间打造无限的网络空间产业创新生态

五大科技伦理十类人工智能伦理准则

增进人类福祉:以人为本,可持续性;尊重生命权利:合作,隐私;坚持公平公正:公平,共享;合理控制风险:共享;合理控制风险:外部安全,内部安全

中国人工智能伦理相关国内政策法规文件

《新一代人工智能发展规划》,《促进新一代人工智能产业发展三年行动计划(2018-2020年)》,《关于加强科技伦理治理的意见》,《中国关于加强人工智能伦理治理的立场文件》

人工智能伦理相关国际政策

《算法透明性和可问责性的声明》,《2018年恶意伪造禁令法案》,《美国人工智能倡议》,《国家人工智能研究与发展战略计划》,《2019年深度伪造报告法案》

人工智能产业集群网络结构的三个极点:北京市、广东省和上海市

从技术合作关系的密度看,北京市,广东省和上海市构成了人工智能产业集群网络结构的三个极点;北京,广东,上海,江苏,安微,四川,湖北,湖南,重庆,山东和福建之间存在密集的人工智能技术合作关系

中国人工智能产业集群分布:京津冀、长江三角洲、珠江三角洲和川渝地区

排第一的是长江三角洲地区,占比 30.95%;排第二的是京津 冀地区,占比 29.36%;排第三的是珠江三角洲地区,占比 26.45%;排第四的是川渝地区,占比 3.55%

人工智能产业集群的基本构成

构成具有全球竞争力人工智能产业集群的首要因素是企业簇群及其产业创新生态;人工智能产业集群发展所倚重的科技创新要素不仅包括数据生态 算力 算法和人才

《中国新一代人工智能科技产业发展 2023》 建设具有全球竞争力的人工智能产业集群

刘刚教授发布了《中国新一代人工智能科技产业发展 2023》人工智能企业及其创新活动构成了人工智能产业集群发展的微观基础,我国人工智能企业数量超过3000家
资料获取
人工智能标准
== 最新资讯 ==
大模型专题一:中国人工智能系列白皮书——
AIoT白皮书:解锁未来商业价值的关键_
AI时代来袭:中小企业如何抓住千载难逢的
人工智能时代的制造业进展与期望-人工智能
从规则走向实践,2023 AI浪潮下的秘
十大趋势重塑未来企业!超越想象的数字变革
喜讯!创泽集团荣膺“国家知识产权示范企业
中国信通院联合发布《数据清洗、去标识化、
“好客山东 好品山东”丨创泽集团受邀参加
ICRA 自然语义引导的机器人技能操作
2023语义增强可编程知识图谱SPG白皮
2023 中国人工智能系列白皮书--人工
2023中国人工智能系列白皮书《人工智能
AI大模型市场研究报告(2023)迈向通
深圳2023人工智能发展白皮书-人工智能
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人底盘 Disinfection Robot 消毒机器人  讲解机器人  迎宾机器人  移动机器人底盘  商用机器人  智能垃圾站  智能服务机器人  大屏机器人  雾化消毒机器人  紫外线消毒机器人  消毒机器人价格  展厅机器人  服务机器人底盘  核酸采样机器人  机器人代工厂  智能配送机器人  喷雾消毒机器人  图书馆机器人  导引机器人  移动消毒机器人  导诊机器人  迎宾接待机器人  前台机器人  消杀机器人  导览机器人 
版权所有 创泽智能机器人集团股份有限公司 中国运营中心:北京 清华科技园九号楼5层 中国生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728