AI语音克隆创业项目未获声音主体授权引发人格权诉讼

1776709778

近年来，AI语音克隆技术迅猛发展，从智能客服、有声读物到虚拟偶像配音，应用场景不断拓展。然而，技术的“高歌猛进”并未同步匹配法律意识与伦理共识，一起由未经许可采集并商业化使用他人声音所引发的人格权纠纷，正悄然揭开行业隐秘的合规裂口。

2023年秋，某初创科技公司“声界智能”推出一款面向教育市场的AI语音助手产品，主打“名师真人音色复刻”，宣称可生成包括多位知名语文特级教师、英语播音员在内的数十种高拟真度语音模型。用户反馈热烈，产品上线三个月即获数万付费订阅。但不久后，一位被“克隆”的中学语文教师林老师发现，自己曾在公开课中录制的数百小时教学音频，竟出现在该公司的训练数据说明文档中——而她从未签署过任何授权协议，亦未收到任何形式的事先告知或事后补偿。

林老师随即委托律师取证，并于2024年初向北京市互联网法院提起人格权侵权之诉，主张被告擅自采集、提取、合成并商业化利用其声音特征，侵害了《中华人民共和国民法典》第1023条所明确保护的“自然人声音权益”。该案成为全国首例以“声音权”为独立案由、聚焦AI语音克隆技术滥用的典型人格权诉讼。

庭审中，争议焦点高度集中：其一，声音是否构成受法律保护的独立人格利益？法院援引《民法典》第1023条第二款：“对自然人声音的保护，参照适用肖像权保护的有关规定”，明确指出，声音具有可识别性、人格专属性与商业价值性三重属性，是自然人人格标识的重要组成部分；其二，AI训练阶段“匿名化处理”能否豁免侵权责任？被告辩称，其仅提取声纹参数、频谱特征等抽象数据，并未存储原始音频，属于“技术中立”。法院驳回该抗辩，强调：即便未保留原始录音，只要通过算法建模实现对特定自然人声音风格、语调、节奏乃至口头禅的稳定复现，即已实质性利用其人格要素，构成对声音权益的直接干预；其三，“非营利性研究”或“用户上传内容免责”是否成立？证据显示，该公司在官网显著位置标注“支持上传任意音频用于个性化语音定制”，并默认将用户提交内容纳入公共训练池。法院认定，平台未设置有效授权机制、未履行显著提示义务、未建立声音来源审核流程，主观上存在明显过错。

2024年6月，法院一审判决“声界智能”立即停止使用林老师声音模型，删除全部相关训练数据及生成内容，在国家级媒体公开赔礼道歉，并赔偿精神损害抚慰金8万元及合理维权支出3.2万元。判决书特别指出：“技术迭代不能成为规避人格尊严底线的挡箭牌。声音权不是数据资产，而是人格权延伸；模型精度越高，责任越重；商业收益越大，义务越明。”

此案虽已审结，涟漪却持续扩散。工信部、网信办随后联合发布《生成式人工智能 voice服务管理指引（征求意见稿）》，首次要求语音克隆类产品上线前须完成“声音主体双确认”机制——即原始声音提供者书面授权 + 最终用户知情同意；中国音像著作权集体管理协会亦启动“声音版权登记平台”建设，探索类比音乐作品的权属存证与分账模式。

更深层的反思正在业界发酵。多位AI伦理学者指出，当前多数语音克隆创业项目仍陷于“技术先行、授权滞后”的路径依赖：算法团队专注提升MOS（平均意见得分）指标，法务部门却常被置于产品发布之后；融资BP中大篇幅渲染“10万+音色库”，却对其中92%的声音来源语焉不详。有投资人坦言：“过去看的是TTS（文本转语音）延迟毫秒数，现在必须把‘声音授权覆盖率’列为尽调硬指标。”

值得留意的是，部分企业已开始主动重构合规框架：一家教育科技公司上线“声音共创计划”，邀请教师自愿参与语音采样，按使用时长与传播范围动态分成；另一家虚拟人平台则嵌入区块链存证模块，每段训练语音均绑定不可篡改的授权哈希值，并向主体开放实时查询与一键撤回权限。

声音，是灵魂振动的物理痕迹，是思想流淌的听觉载体。当AI能以假乱真地模仿我们说话，法律必须比算法更快抵达权利现场。这场诉讼不是技术发展的刹车片，而是人格尊严的校准仪——它提醒所有入局者：最前沿的模型，需以最审慎的尊重为基座；最动听的合成音，应始终回荡着真实主体的同意之声。

15810516463 CONTACT US