AI绘画创业项目训练数据涉嫌盗用艺术家作品惹上官司

1776709131

近期，一场围绕AI绘画创业项目与艺术家版权权益的法律风暴正席卷全球科技与艺术界。多家新兴AI绘图公司被指控在模型训练阶段未经许可大规模抓取、使用数百万幅职业艺术家的原创作品，由此引发多起跨国诉讼，其中最具代表性的案例是美国加州北区联邦地方法院受理的Stable Diffusion集体诉讼案（Andersen v. Stability AI），以及紧随其后的法国、日本及中国台湾地区陆续提起的相似主张。这场争议已远超技术伦理讨论范畴，直指人工智能产业底层逻辑的合法性根基。

据原告方提交的证据显示，某头部AI绘画平台所依赖的开源图像数据集LAION-5B，包含逾50亿张网络图片，其中约12%可追溯至ArtStation、DeviantArt、Pixiv等专业艺术家社区。研究人员通过反向哈希比对与元数据溯源发现，大量训练样本精确匹配特定艺术家于2015—2022年间发布的高分辨率作品——包括签名水印未被清除的JPEG文件、带有唯一EXIF时间戳的PSD源文件片段，甚至部分作品在训练数据集中被刻意裁剪以规避视觉识别，却保留了足以重构风格特征的构图与笔触信息。更关键的是，这些图像从未出现在任何经艺术家明示授权的公共数据集或CC协议许可库中。

艺术家群体的愤怒并非仅源于“被使用”，而在于系统性剥夺其创作价值链条的完整性。一位来自柏林的插画师在法庭证词中指出：“我的三幅系列作品被用于训练该模型生成‘赛博朋克城市夜景’提示词下的数千张变体图，而平台将这些输出图作为商用素材包售予广告公司——我既未获通知，亦未分得一分钱，甚至连署名权都被算法抹除。”这种“输入即掠夺、输出即变现”的闭环模式，使传统版权法中的“合理使用”抗辩陷入困境：美国第九巡回法院在过往判例中强调，商业性AI训练若实质性替代原作市场功能（如风格模仿导致客户转向AI生成方案），则难以构成合理使用；欧盟《人工智能法案》草案亦明确将“未获授权的大规模文化内容训练”列为高风险行为。

值得注意的是，被告方提出的几项核心辩护正在遭遇学理与司法实践的双重质疑。其一，“网络爬虫获取公开内容即视为默示许可”之说，已被美国最高法院在Google v. Oracle案附带意见中否定——公开性不等于可无偿商用；其二，“训练过程不存储原始图像，仅提取抽象特征”之技术主张，在2023年斯坦福大学AI安全实验室实证研究中被证伪：当前扩散模型的潜在空间仍高度保真于训练图像的局部纹理与结构分布，艺术家独特笔刷的频谱特征可被精准逆向还原；其三，“艺术家可主动 opt-out”机制形同虚设——LAION数据集未提供有效退出通道，而平台方所谓“训练后过滤”实际发生在模型部署之后，对已发生的侵权无溯及力。

司法层面的突破性进展正悄然改变博弈格局。2024年3月，日本东京地方法院首次作出倾向性裁定，认定某AI绘图App运营商对27位日本漫画家作品的训练使用构成著作权法第30条之“非亲告罪”要件，责令其暂停相关模型服务并开放训练数据审计权限。与此同时，中国《生成式人工智能服务管理暂行办法》第十二条明确规定：“提供者应当尊重知识产权，不得侵害他人依法享有的知识产权”，国家网信办已启动对境内五家AI绘画平台的数据来源合规性专项审查。

这场官司的本质，是一场关于“数字时代创作主权”的重新定义。当算法能以毫秒级速度解构梵高的星空、临摹葛饰北斋的浪，人类艺术家所捍卫的，从来不只是几张图片的经济收益，而是创作行为本身不可让渡的尊严——那种在不确定中摸索、在失败中迭代、在孤独中赋予意义的精神劳动。技术可以加速复制，但无法替代诞生于血肉经验中的美学判断；模型能学习千万种线条，却无法理解一笔颤抖的勾勒背后，是凌晨三点未眠的凝视与自我怀疑。

未来路径或许不在非此即彼的对抗，而在于构建新型协作契约：如德国“Kunst+KI”联盟推动的艺术家数据信托机制，允许创作者自主设定作品授权层级（训练/生成/商用）并获得实时版税分成；或借鉴挪威国家美术馆的“AI共生计划”，将馆藏数字资源以加密水印+区块链存证方式接入合规训练池。唯有当代码学会叩问“谁的画布”，算法才真正配得上“智能”二字。

15810516463 CONTACT US