让郭德纲说英文段子的AI服务，在国内落地有多难？

2023年11月2日 07:40 • 未来科技

HeyGen的翻译服务过程，根据笔者的实测过程如下：用户需要登录HeyGen网站，上传一段长度在30秒以上的包含人声的视频，然后HeyGen会翻译视频中的声音内容，并生成一段视频中的说话者说翻译后语言的视频。

我国政府对互联网进行的监管比较严格，如果在中国境内向公众提供应用深度合成技术的，要遵守的国内其他法律法规还包括《中华人民共和国网络安全法》《互联网信息服务管理办法》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》等。

近期网上出现了很多名人说外语的视频，比如郭德纲、赵本山说英文段子，霉霉、特朗普说中文，这背后其实一个叫HeyGen的人工智能服务在支持。笔者登录了HeyGen的网站，发现其并不向国内用户开放，服务付费渠道里没有微信和支付宝，而实际上HeyGen的创始人是两位华人，都毕业于同济大学。今天就来研究一下，HeyGen的人工智能服务如果要在国内落地，需要办理哪些手续？

HeyGen的翻译服务过程，根据笔者的实测过程如下：用户需要登录HeyGen网站，上传一段长度在30秒以上的包含人声的视频，然后HeyGen会翻译视频中的声音内容，并生成一段视频中的说话者说翻译后语言的视频。这个神奇的地方在于，生成的视频用的是原视频中说话者的嗓音，并且口型也和发音匹配。

原来，HeyGen的服务至少接入了其他三个人工智能引擎^[i]， ChatGPT-4负责翻译视频里的语音、然后用11labs的语音克隆提取的视频中说话者的嗓音特征，在新生成的视频中让说话者说出来，而wav2lip-2会对生成的新视频的人的唇部做口型同步。

一、HeyGen提供的服务属于深度合成服务

根据我国法规，HeyGen应属于深度合成技术，应受到监管。《互联网信息服务深度合成管理规定》的规定，深度合成技术，是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。

ChatGPT-4的翻译视频里的语音，属于生成或者编辑文本内容的技术；11labs的语音克隆提取的视频中说话者的嗓音特征，属于生成或者编辑语音内容的技术；wav2lip-2对生成的新视频的人的唇部做口型同步，属于生成或者编辑图像、视频内容中生物特征的技术。均属于《互联网信息服务深度合成管理规定》规定的业务场景。深度合成服务提供者有很多义务，具体包括：

1. 常规的合规义务

如不得危害国家安全、社会公共利益、不得侵害他人合法权益；不得制作、传播虚假新闻；建立健全用户注册、算法机制机理审核、科技伦理审查、信息发布审核、数据安全、个人信息保护、反电信网络诈骗、应急处置等管理制度；具有安全可控的技术保障措施规定等。

2. 人工智能服务义务

提供人脸、人声等生物识别信息编辑功能的，应当提示深度合成服务使用者依法告知被编辑的个人，并取得其单独同意；服务生成或者编辑的信息内容，应当添加标识等。

3. 备案和评估手续

HeyGen如果在国内提供服务，要不要做备案和安全评估？2023年4月的《生成式人工智能服务管理办法（征求意见稿）》规定：利用生成式人工智能产品向公众提供服务前，应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。据此，HeyGen以及其接入的ChatGPT-4、11labs、wav2lip-2均应该做安全评估和算法备案。

但2023年7月发布的《生成式人工智能服务管理暂行办法》把这条改了：提供具有舆论属性或者社会动员能力的生成式人工智能服务的，应当按照国家有关规定开展安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。也就是说，只有具有舆论属性或者社会动员能力的生成式人工智能服务才需要做安全评估和算法备案。

但就笔者了解的实践情况，在国内提供服务的文心一言等类似ChatGPT的产品都是需要安全评估和算法备案的，国内以API方式接入ChatGPT的产品基本都被叫停了，可能就是因为其没有做安全评估和算法备案。所以，接入ChatGPT的HeyGen服务如果服务要落地，也需要做安全评估和算法备案。

我国政府对互联网进行的监管比较严格，如果在中国境内向公众提供应用深度合成技术的，要遵守的国内其他法律法规还包括《中华人民共和国网络安全法》《互联网信息服务管理办法》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》等。

二、HeyGen提供的服务涉及个人敏感信息的出境

个人信息的数据出境分为两种情况，一种是数据处理者将境内的数据传输、储存在中国境外；另一种是，数据处理者将境内的数据存储在境外，但是境外的机构、组织或者个人可以访问或调用，但必须屏蔽身份信息。如果要向国内用户提供服务，HeyGen的服务器可以架设在国内，并限制身份信息的出境，这可以解决一部分数据出境问题。

但HeyGen的服务需要使用者上传视频，视频中直接包含可以识别身份的用户的肖像和声音，wav2lip-2、11labs会对人的肖像和语音进行分析，都会提取人的特征文件，如声纹、面部特征和唇形，这些都是生物识别特征，属于敏感个人信息。HeyGen如果拟将从中国国内取得的敏感个人信息传输至境外的，也应当进行数据出境安全评估，并在申报材料中列明敏感个人信息的数量与字段。因为其服务是面向公众的，一旦提供，一定会达到敏感个人信息超过1万人次的监管触发点。

所以哪怕HeyGen的服务器在国内，如果支撑其服务的ChatGPT、wav2lip-2、11labs的服务器都在国外的，其还是要履行敏感个人信息出境的合规义务。同时，ChatGPT的服务目前仍屏蔽中国地区的IP访问，微软必应搜索引擎在海外嵌入了ChatGPT的人工智能服务，但国内也无法使用其人工智能部分。HeyGen即便想给中国用户提供服务，ChatGPT的开发者OpenAI公司也未必会同意。从以上分析看，就目前的政策和法律环境HeyGen想要在国内落地服务，合规方面的挑战还是不小的。

最后说一下人身权和知识产权的侵权风险问题，由于HeyGen提供的是面向用户的一对一视频翻译转换服务，网站并不会向公众发布转换后的内容，所以HeyGen的知识产权的侵权风险较小。但用户如果用HeyGen将他人的讲话视频生成了翻译后的内容发布到网上，就需要取得很多授权。

比如你传了郭德纲的相声视频，就需要取得郭德纲的肖像权、声音权的授权、相声视频的录像制作者权和相声文字内容版权授权，缺少任何一个都可能涉嫌侵权，大家有兴趣的，也可以参考本人之前写的《“AI孙燕姿”有哪些知识产权和法律问题？》一文，那里面的论述比较详细。当然，郭德纲是公众人物，这种无伤大雅的传播其可能未必会维权，但如果其想维权的，发布视频者打官司肯定会输。

参考文献：[i] https://www.techopedia.com/definition/heygen

本文作者：游云庭（上海大邦律师事务所高级合伙人、知识产权律师）。电话：8621-52134900，Email: yytbest@gmail.com，本文仅代表作者观点。

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

打假人王海：李佳琦卖的假和田玉，小杨哥也卖过

Previous 2023年11月1日

AI的春天，无法拯救消费电子的冬天

Next 2023年11月2日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

让郭德纲说英文段子的AI服务，在国内落地有多难？

相关推荐