|
|
当前位置:首页 > ai智能 > 计算机行业浅析AI大模型训练数据来源与版权挑战- AI训练数据版权之争,版权问题重视程度的提升 |
计算机行业浅析AI大模型训练数据来源与版权挑战- AI训练数据版权之争,版权问题重视程度的提升 |
来源:广发证券 时间:2024/10/9 |
AI 大模型训练数据来源广泛。在算力可获得性提升以及算法同质化趋 势下,训练数据成为影响大模型性能的重要因素。区别于传统 AI 模 型,大语言模型通常使用公共文本数据集的混合体作为预训练语料库,而多模态大模型则需要大规模的图片和音视频等多模态数据。这 些训练数据的来源广泛,包含公开渠道、企业自研、直接购买与合作 交换等。 内容持有者对 AI厂商态度各异。部分内容持有者针对 AI 平台提出了 各种维权诉求,已有数十起版权诉讼正在进行中。同时,另一部分内 容持有者则选择了授权合作道路。版权纠纷实质上是商业利益之争, 内容持有者具体选择诉讼还是合作取决于其商业模式、内容d特性和 行业结构等因素。作家和艺术家们普遍倾向于抵制 AI 公司并控诉其 侵权行为,而新闻媒体在版权斗争中则难以形成统一阵线。 确保训练数据的合法来源对于 AIGC 发展非常关键。我们在去年的 《从 Adobe 看 AIGC 如何重塑创意工具行业》报告中提到,训练 数据的版权问题是 AIGC 商业化落地的重要阻碍。因此,只有解决了 这一问题,才能在确保合法的前提下,推动生成式 AI 的商业落地。 从 2023 年下半年开始,AI 数据版权诉讼开始进入白热化阶段,而 内容合作则于 2024 年上半年加速,表明过去一年中版权问题已经成 为 AI L域的焦点,并且相关法律问题正在被逐步揭示与尝试解决。 2024 年有望成为 AI训练数据版权之争的关键年。关于 AI 训练数 据版权诉讼,国内外尚未达成判例,重点案例的判决将对未来行业发 展产生重要意义,需持续关注。同时,越来越多的公司正在明确其立场,显示出行业整体对于训练数据版权问题重视程度的提升。2024 年有望成为 AI 数据版权之争的关键年,将会有更多诉讼、谈判和合 作展开,但未来授权合作或快于法律变革与监管介入。
![]() |
相关推荐 |
»
AIGC赋能带动传媒迎来增长新曲线-约78.9%的营销活动使用了AIGC
» 阅文集团:IP业务高增,AIGC赋能-增长75.7%,AI 翻译作品占比约 40% » 传媒行业AIGC系列研究:大模型和算力服务更快更省,AI应用值得期待,AI应用的开发成本大幅下降,有利于AI应用加速落地 » AI文生视频:开启内容创作新纪元,文生视频模型Sora一次性生成 60 秒视频 » AIGC系列研究:多模态大模型引领,应用端曙光初现,国产大模型从能力到应用进展均有望超预期推进 » 传媒行业AIGC:AI应用落地,难点到底在哪里? 8 个落地方向,8 大落地场景 » 数智时代AI赋能教育教学的实践与挑战白皮书-数据安全、技术伦理和教师适应性等挑战 » AI大模型创业格局报告-6+2竞争格局,核心竞争力、产品与服务、融资情况以及未来趋势 » 2024年AI生产力工具暑期发展报告-移动端渗透率达到38.6%,月活跃用户数(MAU)达到1.7亿 » 中国AI Agent应用研究报告2024-发展背景、特征、应用案例和未来趋势 » AI医学影像行业发展现状与未来趋势蓝皮书-92款人工智能医学影像辅助诊断软件获批 » 脉脉2024大模型人才报告-人才供需比为1.76,薪酬涨幅保持在30%-50% |
![]() ![]() ![]() |
![]() |
|
|
版权所有 © 创泽智能机器人集团股份有限公司 中国运营中心:北京·清华科技园C座五楼 生产研发基地:山东日照太原路71号 电话:4008-128-728 |