创泽机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 行业动态 > 语言大模型能力提升主要体现为四方面:上下文窗口,知识密度增强和强化学习等

语言大模型能力提升主要体现为四方面:上下文窗口,知识密度增强和强化学习等

来源:中国信息通信研究院     编辑:创泽   时间:2024/12/13   主题:其他 [加盟]

OpenAI 等基于大量工程实验和反复验 证提出缩放定律,揭示了模型能力与计算能力、参数量和数据量间 的定量关系,业界也遵循该定律指导资源要素投入、推动模型创新 发展,近年来在模型技术能力、通用泛化水平等方面取得一系列突 破性进展。目前,大模型支持模态已逐步从自然语言处理拓展到多 模态理解和生成等场景。

从 2023 年至今的基准测试结果来看,大模型能力已经出现 阶跃式提升。语言大模型能力提升主要体现为以下四方面。

一是上下文窗口长度扩展,提升全局能力。大模型的上下文窗口长度是指 模型在执行文本生成任务时,能够处理的前置文本的数量或长度, 决定了模型对信息的理解深度和广度,对于理解和生成连贯、一致 且准确的文本具有重要意义。当前,国内外主流大语言模型均具备 128k 以上的上下文长度处理能力,可一次性处理数十万单词或汉字。

二是知识密度增强,储存更多知识。随着数据、算力、算法协同发 展,大模型知识密度持续增强,平均每 8 个月翻一番。2020 年 6 月 发布的 GPT-3 大模型有 1750 亿个参数,2024 年 2 月面壁智能发布 MiniCPM-2.4B 模型在实现同等性能的同时,参数规模降至 24 亿, 相当于知识密度提G了约 86 倍。

三是 MoE 混合专家架构能够容纳更多知识,准确刻画任务。MoE 稀疏激活多个专家子模型支路,加权 融合多个子模型结果,实现更加准确的输出,提G推理计算效率。 目前,谷歌的 Gemini-1.5 Pro、Mistral AI 的 8x7B 与 8x22B、阿里云 Qwen-1.5 MoE、阶跃星辰 Step-2 等头部大模型均采用 MoE 架构, 已 成 为 当 前 大 模 型 的 重 要 演 进 趋 势 。

四 是通过强化学习 (Reinforcement Learning,RL)将思维链(Chain of Thought,CoT) 内化进模型,提升复杂推理能力。2024 年 9 月 OpenAI 发布的 o1 系 列模型在后训练(Post-Training)阶段采用强化学习和思维链的技术方案,不仅在“慢思考”后回答复杂问题的表现优异(尤其是在 STEM L域的推理能力显著增强),还具有了自我反思与错误修正能力, 使自博弈强化学习有望成为提升语言大模型逻辑推理能力的技术新范式。



人工智能产业稳中有进迎来新动能:规模6233 亿,增长21.5%

人工智能产业规模将达到 6233 亿美元,同比增长 21.5%;超过 80%的企业将使用生成式人工智能 API,或部署生成 式人工智能的应用程序,人工智能投融资金额达316 亿美元

人工智能工程化迈向新阶段:应用工具链拓展大模型应用广度

Agent 的引 入,实现了复杂任务的自动化执行与智能决策,多模型编排则有效解决了单一模型局限性问题,大小模型协同机制,J大增强了模型的知识推理与生成能力

人工智能技术演进走向新范式:单任务智能到多任务智能

以大模型为代表的人工智能技术展现出了类人智能的“涌现”能力,呈现规模可扩展、多任务适应及能力可塑三大特征,规模可扩展,多任务适应,能力可塑

人工智能发展报告 (2024 年):技术创新方向,产业升级重点,行业落地趋势和安全治理进展,展望人工智能发展机遇

大模型,多模态模型,智能体和具身智能等L域不断出现突破性创新,推动人工智能迈向通用智能初始阶段,人工智能在实体经济中的应用场景将进一步拓展

人形机器人产品数据库(2024 年):智元机器人 均胜集团 帕西尼感知科技 追觅科技 星动纪元

小鹏 逐际动力 MagicLab 北京仿人机器人创新中心 宇树科技 奇瑞&Aim oga 智元机器人 均胜集团 帕西尼感知科技 追觅科技 星动纪元 均胜集团 浙江人形机器人创新中心 开普勒 星尘智能 福德机器人

2024人形机器人企业画像与能力评估报告:企业总计超150家,任务级能力占40%,技能级能力占60%

人形机器人企业的现状、能力评估及未来发展前景,客观回顾产业历程、识别爆发节点及背后动因,重新定义了人形机器人整机,企业总计超150家,中、美、日三国企业数量占份额>65%

人本智能的产业实践:经历了三个阶段,原则爆发,共识寻求,伦理实践

原则爆发阶段提出了自己的 AI 伦理原则;共识寻求阶段强调 AI 技术应该以人类的尊严和权利为核心;伦理实践阶段多面推进负责任 AI 的落地实施

人本智能的内涵和原则:三个维度的升级,四个发展原则

在人与 AI 两者之间的交互关系上构建一种人机共生的新关系、新范式; 在人与 AI 的目标工具属性关系上共情智能及人机物和谐智能;在人与 AI 发展的价值导向上助力克服健康、环境、教育等L域的关键挑战

构建新型“三线”人机关系:人机协作,人机共生,人在机器之上是底线

人类已经进入一个“人机物”三元融合的万物智能互联时代,人与移动设备的交互方式更G阶的智能体交互正在为人们创造全新的体验,实现超能力替身

新一轮AI下的人机关系:人类社会治理和伦理中的AI

人工智能将被赋予以前只能由人类心智完成或尝试的任务,产生接近乃至超越人类智能所能完成的结果;从“以人类理性为中心”转变为“以人类尊严和自主性为中心”

新一轮AI下的人机关系:人类生产中的AI

通过机器学习和大数据分析,AI 能够辅助医生进行疾病诊断;根据用户的风险偏好,财务状况以及市场动态进行资产配置和投资组合优化;AI 使自动驾驶系统拥有超越人类的感知能力

新一轮AI下的人机关系:人类情感世界中的AI

三分之二(67%)的 Z 世代年轻人认为网络和现实之间的自我表现存在脱节,这进一步 加剧了他们的孤独感和焦虑感;每个人都可以在这个与真实世界平行的虚拟世界中拥有自己的分身
资料获取
行业动态
== 资讯 ==
语言大模型能力提升主要体现为四方面:上下
人工智能产业稳中有进迎来新动能:规模62
2024人工智能中文大模型使用手册:介绍
2024年度AI十大趋势报告重磅发布!从
人工智能工程化迈向新阶段:应用工具链拓展
人工智能技术演进走向新范式:单任务智能到
人工智能发展报告 (2024 年):技术
人形机器人产品数据库(2024 年)
AI使能工业创新白皮书(2024):有关
教育大模型:AI赋能智能教育,塑造未来学
2024人工智能商业应用研究报告:商业潜
2024人形机器人企业画像与能力评估
2024大模型落地与前沿趋势研究报告:大
人工智能行业应用建设发展参考架构:算力基
生成式人工智能应用发展报告(2024):
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人底盘 Disinfection Robot 消毒机器人  讲解机器人  迎宾机器人  移动机器人底盘  商用机器人  智能垃圾站  智能服务机器人  大屏机器人  雾化消毒机器人  紫外线消毒机器人  消毒机器人价格  展厅机器人  服务机器人底盘  核酸采样机器人  智能配送机器人  导览机器人 
版权所有 创泽智能机器人集团股份有限公司 中国运营中心:北京 清华科技园九号楼5层 中国生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728