算法|“深度合成”新规,“元宇宙”关键技术迎来监管

算法|“深度合成”新规,“元宇宙”关键技术迎来监管

毋庸置疑的是 , 人工智能(AI)、大数据、区块链等技术在短短十几年内已经深刻的改变了我们的生活方式 , 在这个日益虚实交融的世界里 , 新的事物在不断被创造 , 并渐渐与旧世代的事物形成更加庞大而复杂的关系网 。
深度合成(Deep Synthesis , 以前曾被称为Deepfake , 即“深度伪造”)作为AI技术的新应用、新实践 , 近年来备受关注 。
一方面 , 利用深度合成技术可以自动生成文本、语音、图像、视频等各种数字内容 , 已经成为了当前元宇宙发展的关键技术;另一方面 , 近年来科技迅猛发展 , 深度合成技术门槛快速降低 , 导致滥用技术的案例频出 , 引发各类风险 。
因此 , 当前亟待以立法的形式对深度合成技术的应用进行规制 , 尤其是要对深度合成内容的用途、标记、使用范围以及滥用技术的处罚作出具体规定 , 同时明确责任主体 , 才能真正实现“技术向善” 。
2022年1月28日 , 国家网信办最新公布了《互联网信息服务深度合成管理规定(征求意见稿)》(简称《深度合成征求意见稿》) , 对作为元宇宙基石的深度合成技术做出了一系列较为明确的规定和指引 。 本文对此文件进行解读 , 以帮助读者明晰:深度合成技术怎么用才合规 。
一、深度合成技术及其在元宇宙中的实际应用
从技术上来说 , “深度合成”技术 , 实质上就是利用深度学习算法来实现的 , 其主要使用的两个技术:自动编码器和生成对抗网络(GAN) 。
一个用来进行新数据的生成 , 一个用来对生成数据进行鉴别 , 经过二者无数次“合作” , 最终生成出极具“真实感”的合成数据 。 当前大家耳熟能详的AI换脸就是利用深度合成所创造的 。
而根据《深度合成征求意见稿》第二条 , 深度合成技术指的是:
利用以深度学习、虚拟现实为代表的生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术 , 包括但不限于:
(1)篇章生成、文本风格转换、问答对话等对文本内容进行生成或者编辑的技术;
(2)文本转语音、语音转换、语音属性编辑等对语音内容进行生成或者编辑的技术;
(3)音乐生成、场景声编辑等对非语音内容进行生成或者编辑的技术;
(4)人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等对图像、视频内容中人脸等生物特征进行生成或者编辑的技术;
(5)图像增强、图像修复等对图像、视频内容中非生物特征进行编辑的技术;
(6)三维重建等对虚拟场景进行生成或者编辑的技术 。
按照该定义 , AI语音 , NFT生成艺术、虚拟演唱会、全息人像投影、虚拟人数字人、AR购物等元宇宙的重要组成部分都属于深度合成技术的具体应用 。 而只要在中华人民共和国境内应用深度合成技术提供互联网信息服务 , 或为深度合成服务提供技术支持的活动 , 均在《深度合成征求意见稿》的规制范围内 。
【算法|“深度合成”新规,“元宇宙”关键技术迎来监管】随着“深度合成”技术逐渐成熟并进入商业化应用阶段 , 其巨大的经济价值已经逐渐向世人展露 。 当前 , “深度合成”已经在音乐、影视、综合娱乐、社交等多个行业的场景中被实际推广应用 。
例如 , 在电影大片的制作中其应用最为成熟 , 不仅可以通过提升音视频制作的效率和质量 , 显著降低影片制作成本 , 还能赋予艺术创作者更大的想象空间 。 甚至深度合成技术还可以使一些已过世的演员进行在影视剧中以虚拟数字人的形态“复活” 。

相关经验推荐