当前位置：首页 > ai智能 > 生成式人工智能行业专题研究：海外大模型篇，生成式AI加速创新，行业迎历史性机遇

生成式人工智能行业专题研究：海外大模型篇，生成式AI加速创新，行业迎历史性机遇

来源：国元证券时间：2024/9/5

1、基础的生成算法模型是驱动AI的关键

2014年，伊恩·古德费洛(lanGoodfellow)提出的生成对抗网络(GenerativeAdversarialNetwork,GAN)成为早期为著名的生成模型。GAN使用合作的零和博弈框架来学习，被广泛用于生成图像、视频、语音和三维物体模型。随后，Transformer、基于流的生成模型(Flow-basedmodels)、扩散模型(DiffusionModel)等深度学习的生成算法相继涌现。

Transformer模型是一种采用自注意力机制的深度学习模型，这一机制可按输入数据各部分的重要性分配权重，可用于自然语言处理(NLP)、计算机视觉(CV)L域应用，后来出现的BERT、GPT-3、laMDA等预训练模型都是基于Transformer模型建立的。

通过梳理主流大语言模型(LLM)的发展脉络，2018年以来的GPT系列、LLaMA系列、BERT系列、Claude系列等多款大模型均发源于Transformer架构。

2、预训练模型引发了AI技术能力的质变

预训练模型是为了完成特定任务基于大型数据集训练的深度学习模型，让AI模型的开发从手工作坊走向工厂模式，加速AI技术落地。

2017年，Google颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构，奠定了大模型预训练算法架构的基础。

2018年，OpenAI和Google分别发布了GPT-1与BERT大模型，意味着预训练大模型成为自然语言处理L域的主流。

3、预训练数据直接决定AI大模型性能

ScalingLaws：模型容量、数据量、训练成本共同构成了大模型训练的不可能三角。大模型训练的目标是大化模型性能，模型训练成本（GPU的数量和训练时间等）是受限的，因此一般通过增加数据集大小和增加模型中的参数量两种途径来提升模型性能。

附件：生成式人工智能行业专题研究：海外大模型篇，生成式AI加速创新，行业迎历史性机遇

分类导航

== 资讯 ==

» 人形机器人运动控制:制约商业化落地
» 山东省机器人产业高质量发展行动计划
» 2025AI赋能教育：高考志愿填报
» 核电人形机器人的八点特性:高辐射耐
» 核电人形机器人专题报告[工业应用场
» 机器人的大脑在手眼脑协同中发挥怎么
» 机器人的“手眼脑”协同有哪些瓶颈和
» “手眼脑”协同对机器人上肢操作能力
» 机械臂+灵巧手当前能够完成哪些工作
» 具身智能——决定机器人泛化能力天
» 服务机器人兼容方面检测：电磁兼容与
» 服务机器人可信方面检测：数据可信、
» 服务机器人可靠方面检测:环境适应性
» AI工具深度测评与选型指南V1-5
» 2025基于DeepSeek的详细