近日,一位国外游戏设计师的作品《太空歌剧院》夺得了美国科罗拉多州博览会艺术比赛数字类别的一等奖。据了解该画作完全由 AI 绘图软件根据文字指令生成,是不折不扣的 AI 画作,这样的结果引来了不少传统艺术家的指责,一时间,关于 AI 作画是否是作弊、人类艺术消亡的讨论引爆网络。
(相关资料图)
AI 作画正是大量 AI 模型训练后的技术能力输出的方向之一。Gartner 发布的 2022 年 AI 技术成熟度曲线显示:生成式 AI、AI 大模型等技术在萌芽 2 年多后已快速步入期望膨胀阶段,生成式 AI 更是被 MIT 科技评论列入 “2022 年全球十大突破性技术”、是 Gartner“2022 年的 12 项顶级战略技术趋势” 之一。
什么是生成式 AI?
2020 年,生成式 AI 首次出现在 Gartner 技术成熟度曲线上。根据 Gartner 官网,预计到 2025 年,生成式 AI 将占所有生成数据的 10%。
生成式 AI 是指利用现有文本、音频文件或图像等创建新内容的技术。生成式 AI 可从其数据中学习内容或对象,并运用数据生成全新的、完全原创的、逼真的工件,留下与训练数据相似的特征,而不是简单的重复。生成式 AI 有潜力创造新形式的创意内容,例如视频,并可加快从医学到产品创造等领域的研发周期。
企业可以通过两种方式使用生成式 AI:一是与业务部门一起增强当前的创新工作流程,开发自动化以帮助人类更好地执行创造性任务。例如游戏设计师可以利用生成式 AI 来创建地下城,突出他们喜欢和不喜欢的内容。二是充当业务流程的重要部分,生成式 AI 可以在几乎没有人为参与的情况下生产无数的创意作品。它只需要设置上下文,结果将独立生成。
与此前广受争议的深度伪造 Deepfake 相似,生成式对抗网络 (GAN) 与变分自动编码器 (VAE) 也都是生成式 AI 的关键技术。其中,生成式对抗网络更广泛地用于图像处理,而变分自动编码器则更多地用于信息压缩。
生成式对抗网络本质上是一种深度学习模型,在原理上,生成式对抗网络使用两个神经网络相互对立,一个生成器和一个判别器。生成器或生成网络,负责生成类似于源数据的新数据或内容,判别器或判别网络则负责区分源数据和生成数据。经过交替周期训练,双方在对抗中不断完善。生成器不断学习生成更逼真的数据,判别器则更善于区分假数据和真实数据。变分自动编码器可以为具有不同机制的各种任务创建更有效的分类引擎。它们的核心建立在组成的神经网络的一个自动编码器和一个自动解码器上。编码器优化表示数据的更有效方式,而解码器优化重新生成原始数据集的更有效方式。传统上,自动编码器技术清理数据、改进预测分析、压缩数据并为其他算法降低数据集的维数。变分自动编码器更进一步,以尽量减少原始信号的误差与重建误差。
生成式 AI 的巨大潜力
IDC 报告预测,2025 年全球 AI 市场规模将达到 2218.7 亿美元。其中,中国约占全球总规模 8.3%,位列单体国家第二。《中国 AI 数字商业产业展望 2021-2025》报告认为,从中国 AI 应用表现看,以生成式 AI 和组合式 AI 为代表的人工智能新兴技术将成长为中国数字商业产业链的关键应用技术栈。
生成式 AI 是最引人注目和最强大的 AI 技术之一,在各行各业有着广泛的使用案例。
例如在工业设计领域,企业可以将不同的限制条件提供给 AI,由 AI 设计出一些不同的方案以供选择。
在媒体内容生成方面,生成式 AI 可以处理并生成图片、音频、视频、文件、语言等不同类型数据。比如界面原型设计工具 Pencil 可以将企业上传的字体、颜色、LOGO、图片等素材生成可用于营销或广告用途的海报或视频等内容。
此外,生成式 AI 还可用于增强式编程,通过计算机或机器辅助程序员写代码,当前微软、Github、OpenAI 都在使用这种技术。
以多模态形式呈现的数字人、虚拟偶像等也是生成式 AI 的应用方向。数字主播的声音、表情、动作是通过背后的大模型实时生成并融合呈现的。
以上种种都可以归结为数字产品,此外,生成式 AI 还为陷入困境的企业数据使用打开了新的可能性,即在真实数据的基础上制作合成的数据。虽然单条生成数据可能面目全非但其数据集的整体分布,包括方差、均值都与原始数据十分接近。即其在保留数据价值的同时将涉及数据安全的隐私部分隐去。
合成数据有望提高数据资源的丰富度,以合成数据辅助 AI 训练也已成为国际通用的手段,它可以为工业机器人或自动驾驶车辆设计数百万个不同的训练场景。国内商业公司中,支付宝基于实物建模技术与渲染技术提出应用于视觉零售的 3D 合成方案,也是运用合成数据有效降低了模型训练中的数据成本,避免了人工标注数据带来的不可靠性。
Unity 总裁约翰·里奇蒂洛认为合成数据可以无偏差地训练人工智能的算法,人们可以随时退回到之前的过程查看和分析算法。这在真实世界数据强化的过程中,需要几天几周几个月才能做到,但是用合成数据几乎即刻就能完成。
Gartner 研究总监闫斌认为,合成数据在未来企业的应用中存在较大的发展空间,且与全球市场相比,国内的合成数据厂商较少,机会更多。合成数据可实现不同企业间数据的汇集,并应用于更加安全的第三方分析工作、厂商选型、测试以及一些云上的应用,以及在脱敏和合规基础上的数据变现,尽可能地保留数据价值。
逻辑与安全性尚待提升
当前,生成式 AI 与合成数据发展趋势迅猛,被视为有望掀起人工智能 2.0 的浪潮。但距离大规模商用还有很多困难需要克服。现有的生成式 AI 的应用还存在一些局限,比如在常识、逻辑和推理;复杂上下文的长期记忆以及对于数据的依赖性和效率方面。
人工智能专家认为,生成式 AI 在未来还需关注以下问题:
合成数据的评估问题。在全面应用合成数据集之前,需要充分研究合成数据集与真实数据集的差异,从而避免应用合成数据集带来的偏差。如何评估合成数据集与真实数据集的差异仍是一个亟待解决的问题。
合成数据仍存在 “非自然数据” 的问题。目前大多合成数据技术基于统计机器学习的方法,由于经典统计学只关注了数据中蕴含的相关性,而忽视了因果性,因此有可能会生成不合逻辑的数据。例如合成图像中出现的具有异常背景的图像,这类数据被称为 “非自然数据”,它对智能算法的鲁棒性和可靠性将造成何种影响目前仍然未知。刻画影响的边界并提早思考应对措施将会是合成数据能否进入风险敏感领域的关键。
合成数据的安全性问题,主要包括生成对抗网络等模型的稳定性问题会带来预期之外的生成结果、对于原始训练样本的记忆容易导致隐私泄露以及被不法分子用于诈骗等风险。
且在实际应用中,合成数据也存在一些无法模拟的场景,也不适用于人脸检测、物体识别等人工标注成本较低的任务,对于低成本实现动态场景模拟等技术难点还需进一步攻克。
关键词: AI生成式AI