首页
产品系列
行业应用
渠道合作
新闻中心
研究院
投资者关系
技术支持
关于创泽
| En
 
  当前位置:首页 > 新闻资讯 > 机器人开发 > 常见的人工智能大模型:NLP,CV和多模态大模型  
 

常见的人工智能大模型:NLP,CV和多模态大模型

来源:高工机器人      编辑:创泽      时间:2024/10/17      主题:其他   [加盟]

人形机器人的“大脑”是指基于人工智能大模型的机器人控制系统,用于实现机器人的 感知、决策、学习和控制等功能。2023 年,随着人工智能大模型技术的快速迭代,为人形机 器人的产业落地提供了重要的技术支撑。在人-机-环境交互方面,大模型可以接受视觉、语言、触觉等多种信息输入,提升交互能力。人工智能大模型是实现G度智能化人形机器人的 关键技术之一。

目前常见的人工智能大模型有 NLP(Natural Language Processing,自然语言处理) 大模型、CV(Computer Vision,计算机视觉)大模型和多模态大模型等。

1、NLP(Natural Language Processing,自然语言处理)大模型

NLP 大模型是人工智能L域的重要研究方向,融合了语言学、计算机科学、机器学习、 数学、认知心理学等多个学科L域的知识。自然语言处理包含自然语言理解和自然语言生成 两个方面,常见任务包括文本分类、结构分析、语义分析、知识图谱、信息提取、情感计算、 文本生成、自动文摘、机器翻译、对话系统、信息检索和自动问答等。研究内容覆盖的粒度 包括字、词、短语、句子、段落和篇章等多种层次。由于语言的复杂性,G精度、G鲁棒、 可解释的通用自然语言处理系统目前还没有成熟解决方案,仍需进行长期研究。

2、CV(Computer Vision,计算机视觉)大模型

CV(Computer Vision,计算机视觉)大模型是指基于深度学习的计算机视觉模型,通 常用于图像识别、目标检测、人脸识别、图像分割等计算机视觉任务。计算机视觉作为人工 智能和深度学习的子L域,目前主要以深度卷积神经网络(CNN)和 Transformer 为支撑, 针对各个应用场景开发优化类人视觉功能,例如厂商利用图像识别、图像和视频搜索、视频 合成等技术应用于汽车交通、媒体标签等常用场景。

3、多模态大模型

多模态大模型是指将文本、图像、视频、音频等多模态信息联合起来进行训练的模型。 这种模型可以处理和分析多种类型的数据,例如文本、图像、视频和音频,从而更多面地理 解和利用各种信息。多模态大模型的训练通常采用深度学习技术,通过对大量多模态数据进 行学习,模型能够从数据中提取出更丰富、更复杂的信息。多模态大模型在许多L域都有应 用,例如自然语言处理、计算机视觉、音频处理等。






机器人各部位关键技术分析

机器人大脑提高人形机器人的人-机-环境共融交互能力,支撑全场景落地应用;机器人小脑提升人形机器人非 结构化环境下全身协调鲁棒移动、灵巧操作及人机交互能力

大模型在机器人领域研究与应用案例汇总

英伟达 GR00T让人形机器人理解自然语言文本,语音,视频,以模仿人类运动;阿里云机器人大模型可赋予机器人知识库问答,工艺流程代码生成,机械臂轨迹规划,3D目标检测和动态环境理解等全方位能力

智能机器人纯视觉与激光雷达方案比较

纯视觉方案:成本低,技术成熟度高,产业链成熟度高,符合人眼逻辑;易受天气影响,易受光照影响,算力需求较高,需要大量图像训练集;激光雷达方案:识别率高,环境适应力强,产业链成熟度高

人形机器人四种环境感知传感器各项性能比较

摄像头可实现测距,但精度较低,通过 AI 算法识别,但难 以识别非标准障碍物;毫米波雷达纵向精度高,横 精度低;激光雷达是高精度,3D 建模,易识别;

全球主要人形机器人的控制解决方案汇总

本田 ASIMO由四个运行着 VxWorks 实时操作系统的处理器构成;欧洲 ICUB使用名为 ARCHER 的学习型算法体系;特斯拉 Optimus用Optimus 的神经网络

人形机器人丝杠行业深度报告: 核心传动精密部件,国产化未来可期,市场规模249.5亿元

人形机器人将实现从0到1量产,根据我们测算,2025年和2030年全球人形机器人市场规模 分别有望达到1.4亿元和249.5亿元,2025-2030年全球人形机器人CAGR有望达到182%

人形机器人执行系统之灵巧手-空心杯电机

人形机器人灵巧手进行抓取动作,空心杯电机为核心部件;信号解析 汇总执行 输出转速 (高速、低扭矩) 降速增扭 直线传动转 换为旋转传 动 驱动传导 感知及力 反馈

人形机器人执行系统之旋转执行器-减速器

旋转执行器分布于肩部、手部等多自由度关节,作用是将某物旋转到一定角度完成旋转运动;驱动关节完成旋转动作,减速器为核心部件

人形机器人执行系统之线性执行器-行星滚柱丝杠

线性执行器位于膝肘等单自由度及腕踝等双自由度关节,将电机旋转运动转为直线运动;变旋转运动为直线运动,行星滚柱丝杠为核心部件

人形机器人整体构造及成本拆解:执行系统较为关键

人形机器人感知系统成本占比7.3%,执行系统成本占比53.2%;线性执行器成本占比31.0%;旋转执行器成本占比17.9%;其他成本占比39.5%

人形机器人BOM拆解分析-三大核心部分

执行系统BOM占比最高,约53.2%(其中直线、旋转、手部分别 占31.0%、17.9%、4.3%);感知系统占7.3%,其他芯片、电池等部件合计占比39.5%

中国人形机器人研发团队-24支机器人团队介绍

国防科技大学Blackman;哈尔滨工业大学HIT Humanoid; 理工汇童;浙江大学悟空;优必选WalkerX、优悠;小鹏汽车PX5;达闼科技XR-4;北京钢铁侠
 
资料获取
新闻资讯
== 资讯 ==
» 2026十大央国企AI+场景标杆案例集-
» 四足机器人场景应用发展蓝皮书-市场约70
» 迎宾机器人的位置传感器:电位器、光电编码
» 人形机器人上岗餐饮酒店服务场景(如迎宾、
» 智能清洁机器人在商业综合体清洁场景,。模
» 中国人工智能系列白皮书—-具身智能(20
» 腰部外骨骼机器人,20kg的攀登与行走助
» 室内安防巡检机器人的数据中心巡检场景:多
» 光伏机器人清洁太阳能板的七大优点:独有性
» 2025上海智能机器人百大场景案例集-重
» 具身大模型:人形机器人智慧内核,主流框架
» 具身智能数据行业研究白皮书2026-数据
» 2025上海市“AI+制造”发展白皮书,
» Hermes橙皮书《Hermes Age
» 清华大学《OpenClaw在企业办公中的
 
== 机器人推荐 ==
 
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人底盘

机器人底盘

 

商用机器人  Disinfection Robot   展厅机器人  智能垃圾站  轮式机器人底盘  迎宾机器人  移动机器人底盘  讲解机器人  紫外线消毒机器人  大屏机器人  雾化消毒机器人  服务机器人底盘  智能送餐机器人  雾化消毒机  机器人OEM代工厂  消毒机器人排名  智能配送机器人  图书馆机器人  导引机器人  移动消毒机器人  导诊机器人  迎宾接待机器人  前台机器人  导览机器人  酒店送物机器人  云迹科技润机器人  云迹酒店机器人  智能导诊机器人 
版权所有 © 创泽智能机器人集团股份有限公司     中国运营中心:北京·清华科技园九号楼5层     中国生产中心:山东日照太原路71号
销售1:4006-935-088    销售2:4006-937-088   客服电话: 4008-128-728