当前位置:首页 > ai智能 > AI视频生成研究报告-由检索生成、局部生成走向依靠自然语言提示词的全量生成
 

AI视频生成研究报告-由检索生成、局部生成走向依靠自然语言提示词的全量生成

来源:量子位智库    时间:2024/10/17

技术趋势:视频生成正在由检索生成、局部生成走向依靠自然语言提示词的全量生成,生成内容更加灵活丰富,应用空间广阔

检索生成主要是对现有的视频素材根据关键词和标签进行检索匹配,再进行相应的拼接和排列组合

特点

1 采用传统的跨模态视频检索技术,通过视频标 签的或者视频语义理解的方式从数据库中的检 索,再将这些素材进行剪辑、组合拼接在一起, 本质上还是键值对匹配的逻辑

2 例如短视频平台的知识类视频、解说类视频, 通过文本关键字在数据库中进行素材检索,然 后在进行拼接组合生成

3 创意空间有限,没有贡献增量素材,但成本J 低,生成速度J快

仅针对视频的一部分进行生 成,例如视频中人物角色、 动作、背景、风格化、特殊 效果等

特点

1 采用传统的计算机视觉(Cv)、计算机图形学 (CG)技术,但生成功能有限,主要是一些局 部的垂点功能

2 例如效果生成,在现有视频上添加多种效果, 如滤镜、光影、风格化、美颜特效等。也可以 做局部动态化,如人物的面部表情生成、搞笑 表情、爆款特效、舞蹈动作生成等

3 有一定创意空间,生成部分新元素,成本低但 应用的场景有限

通过文字、图片、视频作为提示 词来进行凭空生成,不依赖外部 素材,核心在于大模型的能力

特点

1 采用基于Transformer或者扩散模型的大模型路 线,可以通过自然语言或者指导图进行全局生成 (但也可以嵌入已有内容),视频的内容、风格、 长短、分辨率、宽G比都可以进行灵活调整

2 例如生成天马行空的创意视频、艺术视频、卡通 视频等等,非常灵活

3 创意空间无限,所有的元素都是全新生成,现 阶段成本G昂,但天花板G,应用场景广泛

附件:AI视频生成研究报告-由检索生成、局部生成走向依靠自然语言提示词的全量生成



 
 
 
相关推荐
» 2024汽车AI大模型TOP10分析报告-汽车行业的应用现状和发展趋势
» 通用大模型2024年发展趋势:多功能与小型化
» 大模型基准测试体系研究报告(2024年) -方升大模型基准测试体系
» 2024大模型行业可信应用框架研究报告-前沿技术创新探索、可信应用框架落地实施
» 2024年中国AI大模型场景探索及产业应用调研报告-参数规模在100~200亿
» 生成式人工智能-海外合规白皮书(东南亚篇)-AI行业在合规方面面临独特的挑战和要求
» 未来已来:AI组织进化论-3个假设分成AI应用范式,打造即插即用的模块化能力
» 2024开启AI智能化新纪元白皮书:公正性、透明性和安全性是重要责任
» 2024中国人工智能教育蓝皮书-市场规模将超790亿元,增长率超13%
» AI+智慧城市安全解决方案白皮书:安全需求,全体系架构和安全方案落地具体场景
» 2024中国AI Cloud行业趋势报告-五大趋势引领行业发展,中文语境中表现突出
» 腾讯研究院2024人机友好空间探索报告-智能机器人在现代城市空间的应用及其对人类生活的影响
 
 
 
  » 联系我们
X 关闭  
 
网站首页
关于创泽 公司简介   资质荣誉   企业文化
新闻资讯 公司新闻 [机器人新闻 董事长新闻 比赛与荣誉类]  行业动态
解决方案 商用服务机器人   陪护机器人   安防机器人   智能医疗机器人  党建机器人
服务支持 常见问题   下载
人才招聘 招聘信息   精彩瞬间
党群建设 党建活动   工会活动   其他活动
商务合作 招募支持   报名提交
联系我们 售后服务   留言咨询
   
   
 
联系我们  
北京·清华科技园C座五楼
山东省日照市开发区太原路71号

扫码关注微信公众号
版权所有 © 创泽智能机器人集团股份有限公司           中国运营中心:北京·清华科技园C座五楼       生产研发基地:山东日照太原路71号       电话:4008-128-728