ChatGPT卷起了一场龙卷风,让AIGC(人工智能生成内容)技术烈火燎原,燃烧整个科技界。无论是文本、图片还是视频创作,该技术都在被人们热烈追捧。
然而,这种技术狂飙也让很多人感到忧虑,担心这项新兴技术会被不法之徒所滥用。尤其是在创意和版权领域,生成式人工智能已经被“洗稿”“抄袭”“剽窃”等负面舆论笼罩。甚至导致一些学者和艺术家开始抵制人工智能学习作品,掀起一股反对潮流。在资本市场,数字水印等“反ChatGPT”技术也一度成为热门概念。
当我们走入AI时代的大门,现在有哪些技术已经开始对创作者产生影响,这是值得思考的问题。哪些人工智能技术能够真正地盗取我们的创作成果呢?人工智能之间的对抗是否能够产生实际效果呢?让我们来逐一揭秘。
视频领域的AI到底是什么?
人们常常提及的AI(人工智能)一般是指机器学习和深度学习的分支,是计算机科学的一个领域。其中,视频和图像的研究属于深度学习的范畴。简单来说,这是一种将大量图片和视频交给计算机进行特征提取,进而实现内容理解和内容生成的技术。这门学科本身基于统计学,因此所有结果的准确性都是概率值。AI并非完全准确,也无法做到完全准确。
AI视频编码,是AI技术的成熟应用之一,早在2016年的英雄联盟职业联赛转播,就用到了“极速高清/窄带高清”技术。它是通过AI动态调控H264编码参数,使得在一定码率下,直播视频更为清晰。VVC(H266)编码甚至把它纳入到标准之中。
我们所熟知的人脸识别,也是AI应用较为成熟的领域。由于去年元宇宙的概念兴起,数字人的应用开始推广,计算机视觉也开始应用于人体动作识别、面部表情识别等领域,使得用户可以驱动数字人。
然而,技术总是把双刃剑。既可能改善我们工作和生活状态,也会带来危害。
如今的AI技术,对创意和知识产权产生怎样的威胁?
首屈一指的当属内容擦除技术。利用AI,可以对视频和图片中的各种内容进行识别和分析。比如,可以识别出字幕、台标、水印等特定元素,并在擦除这些元素后,再利用AI进行相应位置图像的补充和修复。这样就完成了AI对于水印的消除。
2021 到 2022 年,自动生成图片的技术出现了突破性的进展,AI绘画类应用越来越多,它们能通过简单的 prompt 生成独具艺术感的图片。即使经常由于输入的描述不清,导致生成怪异的画面,但已经让很多画师面临失业风险。而在版权问题上,“喂”给AI的作品有很多都是被无授权转载的,有很多人发帖称,通过AI获得的作品和一些画师的风格很像,有些作品类型几乎就是“复制粘贴”。
AIGC进行视频洗稿也是人们非常关注的话题之一。由一个视频,换一种风格和形式生成新的视频再次发布,视频平台的查重技术难以检测,也就很难判断原作,进行处罚。但庆幸的是,目前这项技术还很不成熟。
视频的洗稿,需要将视频的每一帧进行AI生成,不仅需要保证单个画面生成的准确性,还需要保证时序上的连续性。这对目前的AI来说,很难做到。即使生成出来,也需要大量的人工矫正。
即便如此,随着算法的演进和训练集素材数量的提升,相信在不久的将来,也会成为视频创作者版权保护的重要威胁。
数字水印、盲水印,能否有效保护版权?
基于这些担忧,有不少人认为,用AI对抗AI,可以进行版权保护。数字水印和盲水印技术甚至成为资本市场炒作的概念。它们到底是什么?又是什么原理?
首先需要指出的是,无论是数字水印还是盲水印,它们的技术内核,不能说和AI同出一门,只能说是毫无关系。
人眼对于画面的感知,可以分为高频信息、低频信息。在一支视频中,人眼对画面中的低频信息往往不敏感。传统的视频有损压缩,就是将这些人眼无法敏锐感知的信息移除,压缩视频体积。数字水印技术是在编码后将相对低频的信息以一定规律进行填充,从而在视频中隐藏某些数据。例如,在AVC(H264)编码中,会先将图像切割成 8X8、16X16的宏块,再通过DCT变换和Zigzag扫描将人眼容易识别的信息和不易识别的信息有序排列,那么在较为不易识别的信息中,加入特定数字,就可以将某些信息以不可见的方式放入视频中。
早期的数字水印技术,本身填充信息就存在于低频信息中。通过转码、录屏等行为,实际上非常容易将这些信息移除,需要依赖一些冗余手段来保证这些信息解析时可用。随着数字水印技术的发展,低频信息中存储的不再是是纯数字信息,可以把图像(如品牌Logo)的黑白版本混入低频信息再进行提取,这就是盲水印的工作原理。但数字水印、盲水印被轻易移除仍然是这一信息技术努力攻克的方向。
就是因为数字水印、盲水印是在人眼无法识别的视频低频信息中做处理。要擦除这些水印,实际比擦除传统的显性水印要更为容易。
与传统显性水印不同,盗版方一旦了解到添加水印的规则,可以很轻易的破解和移除数字水印或者盲水印。数字水印移除的破解代码,甚至是移除后生成假的数字水印的开源代码也比比皆是。
其唯一的优势在于,在一开始较难发现视频中是否存在数字水印/盲水印,也不易发现其规则。这种情况下,虽然可以进行数字水印擦除,但在擦除操作后,难以确认是否完整擦除。
而传统显性水印,由于肉眼可见,对于盗版方会有较强的警示作用,降低录屏、盗流的概率。就当前的技术手段而言,并不是所有的传统显性水印都可以完整地被AI所完美移除。相较之下,传统显性水印,更为安全实用。
什么样的显性水印,可以有效保护视频版权?
既然AI可以进行水印擦除,那么什么样的显性水印是不易被AI擦除的呢?
我们回到AI擦除水印的原理,它需要把水印进行擦除和再生成。而AI的准确率又无法达到100%。在擦除环节,AI需要识别出水印并擦除,那么半透明的大面积的水印,可以大幅降低AI识别的准确率。而四角的简单文字,则很容易被AI移除。
生成部分来讲,AI需要分析图像内容,根据训练的大量数据,再次生成图像。视频领域中,还需要保证时序连续性。这时候,大面积被擦除的内容,会大大增加AI生成画面内容的难度。
分秒帧的水印副本功能,目前开放了斜向全屏水印和横向全屏水印两个模板,就是根据这一原理。模板中的水印都存在一定的透明度,且占据了绝大部分画面,AI擦除技术很难将其完美移除。即使移除并生成了新的视频,也能肉眼分辨出。
如果你需要给客户看样片和创意,可以一键创建带有水印的副本,分享和展示它,就能解除你对资产和创意安全隐忧。
原文链接:https://www.bilibili.com/read/cv22081666/