AI语音克隆创业项目未获声音主体授权引发人格权诉讼
1776709778

近年来,AI语音克隆技术迅猛发展,从智能客服、有声读物到虚拟偶像配音,应用场景不断拓展。然而,技术的“高歌猛进”并未同步匹配法律意识与伦理共识,一起由未经许可采集并商业化使用他人声音所引发的人格权纠纷,正悄然揭开行业隐秘的合规裂口。

2023年秋,某初创科技公司“声界智能”推出一款面向教育市场的AI语音助手产品,主打“名师真人音色复刻”,宣称可生成包括多位知名语文特级教师、英语播音员在内的数十种高拟真度语音模型。用户反馈热烈,产品上线三个月即获数万付费订阅。但不久后,一位被“克隆”的中学语文教师林老师发现,自己曾在公开课中录制的数百小时教学音频,竟出现在该公司的训练数据说明文档中——而她从未签署过任何授权协议,亦未收到任何形式的事先告知或事后补偿。

林老师随即委托律师取证,并于2024年初向北京市互联网法院提起人格权侵权之诉,主张被告擅自采集、提取、合成并商业化利用其声音特征,侵害了《中华人民共和国民法典》第1023条所明确保护的“自然人声音权益”。该案成为全国首例以“声音权”为独立案由、聚焦AI语音克隆技术滥用的典型人格权诉讼。

庭审中,争议焦点高度集中:其一,声音是否构成受法律保护的独立人格利益?法院援引《民法典》第1023条第二款:“对自然人声音的保护,参照适用肖像权保护的有关规定”,明确指出,声音具有可识别性、人格专属性与商业价值性三重属性,是自然人人格标识的重要组成部分;其二,AI训练阶段“匿名化处理”能否豁免侵权责任?被告辩称,其仅提取声纹参数、频谱特征等抽象数据,并未存储原始音频,属于“技术中立”。法院驳回该抗辩,强调:即便未保留原始录音,只要通过算法建模实现对特定自然人声音风格、语调、节奏乃至口头禅的稳定复现,即已实质性利用其人格要素,构成对声音权益的直接干预;其三,“非营利性研究”或“用户上传内容免责”是否成立?证据显示,该公司在官网显著位置标注“支持上传任意音频用于个性化语音定制”,并默认将用户提交内容纳入公共训练池。法院认定,平台未设置有效授权机制、未履行显著提示义务、未建立声音来源审核流程,主观上存在明显过错。

2024年6月,法院一审判决“声界智能”立即停止使用林老师声音模型,删除全部相关训练数据及生成内容,在国家级媒体公开赔礼道歉,并赔偿精神损害抚慰金8万元及合理维权支出3.2万元。判决书特别指出:“技术迭代不能成为规避人格尊严底线的挡箭牌。声音权不是数据资产,而是人格权延伸;模型精度越高,责任越重;商业收益越大,义务越明。”

此案虽已审结,涟漪却持续扩散。工信部、网信办随后联合发布《生成式人工智能 voice服务管理指引(征求意见稿)》,首次要求语音克隆类产品上线前须完成“声音主体双确认”机制——即原始声音提供者书面授权 + 最终用户知情同意;中国音像著作权集体管理协会亦启动“声音版权登记平台”建设,探索类比音乐作品的权属存证与分账模式。

更深层的反思正在业界发酵。多位AI伦理学者指出,当前多数语音克隆创业项目仍陷于“技术先行、授权滞后”的路径依赖:算法团队专注提升MOS(平均意见得分)指标,法务部门却常被置于产品发布之后;融资BP中大篇幅渲染“10万+音色库”,却对其中92%的声音来源语焉不详。有投资人坦言:“过去看的是TTS(文本转语音)延迟毫秒数,现在必须把‘声音授权覆盖率’列为尽调硬指标。”

值得留意的是,部分企业已开始主动重构合规框架:一家教育科技公司上线“声音共创计划”,邀请教师自愿参与语音采样,按使用时长与传播范围动态分成;另一家虚拟人平台则嵌入区块链存证模块,每段训练语音均绑定不可篡改的授权哈希值,并向主体开放实时查询与一键撤回权限。

声音,是灵魂振动的物理痕迹,是思想流淌的听觉载体。当AI能以假乱真地模仿我们说话,法律必须比算法更快抵达权利现场。这场诉讼不是技术发展的刹车片,而是人格尊严的校准仪——它提醒所有入局者:最前沿的模型,需以最审慎的尊重为基座;最动听的合成音,应始终回荡着真实主体的同意之声。

15810516463 CONTACT US

公司:新甄创数智科技(北京)有限公司

地址:北京市朝阳区百子湾西里403号楼6层613

Q Q:15810516463

Copyright © 2024-2026

京ICP备2025155492号

咨询 在线客服在线客服
微信 微信扫码添加我