|
|
当前位置:首页 > 人工智能 > 多模态问答的方法和挑战 |
多模态问答的方法和挑战 |
来源:青源会 时间:2022/10/14 |
多模态检索成为近期关注的问题,当前的方法包括单流方法、多流方法,以及不同模态之 间对齐的技术,已经在知识挖掘L域开展应用。
图像问答可以分为三个层次:1.初J:从图像识别啲结果中直接得到答案 2.中等:答案需要简单事实的支持 3.GJ:对于复杂的问题,答案不在图像中,可能涉及常识、具体 话题和百科知识进行推理 多模态问答的挑战:1 多模态数据具有异构性 2 多模态数据的关联难度表示较大 3 多模态知识融合困难 4 多模态问答大多只能处理简单的问题 5 多模态知识问答推理能力弱 6 多模态知识问答可解释性差
|
相关推荐 |
»
视觉大模型拥有18亿参数 30亿的标注图像进行训练
» 任意文本到图像生成模型 DALLE模型 Imagen模型 » 2022人工智能时代的算法治理报告-构建法律、伦理、技术协同的算法治理格局 » 《2022年中国人工智能医学影像产业研究报告》基层篇 » 中国银行业协会团体技术报告《人工智能模型风险管理框架》 » 多模态预训练大模型-十大科技趋势 » Chiplet 的互联标准将逐渐统一,重构芯片研发流程 » 软硬融合云计算体系架构-十大科技趋势 » 计算光学成像-十大科技趋势 » 2023人工智能和虚拟现实将如何改变职场世界报告-人才获取的崭新时代 » 中小学阶段的人工智能课程报告-人工智能课程的重点考虑因素 » 深圳2023人工智能发展白皮书-人工智能产业链应用场景 |
![]() ![]() ![]() |
![]() |
|
|
版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |