AI生成图像激发了前所未有的讨论热潮。故事要追溯到六十年前,彼时,计算机图像领域对AI图像生成技术的探索已经拉开帷幕。从最初的电脑控制机械臂作画,到如今利用深度学习算法和神经网络,AI图像生成技术实现了跨越式的发展。2014年,伊恩·古德费洛(Ian Goodfellow)领衔研发了生成对抗网络(Generative Adversarial Networks,简称GANs),其最重要意义在于开创了一种全新的生成模型训练方式,为机器学习的发展开辟了新的方向,也为后续AI图像生成技术打下基础。随后扩散模型(Diffusion Model)凭借更出色的生成结果取代了对抗生成网络,成为图像生成领域更热门的算法,由此衍生出了Clip + Guided Diffusion、Dall-E 2、Stable Diffusion等新的模型。 2022年下半年,这一领域的发展达到了一个新的高峰。Stability AI发布了开源版的Stable Diffusion,随后Midjourney也闪亮登场。各种基于扩散模型和多模态向量嵌入技术的“文生图”产品如雨后春笋般涌现,其生成的图片质量之高,速度之快,远超此此前公众对于AI图像生成技术的想象。 尽管AI图像生成技术的发展和应用正在不断扩大,但人们对其接受度却不尽相同。不少技术爱好者借助这些工具在社交媒体上发布AI生成的“新闻照片”,诸如特朗普被捕等内容,甫一发布便冲上热搜,随之而来的便是社会对于这一技术的广泛热议。一些人欢迎这种新的创作方式,认为它可以带来新的视角和可能性。然而,也有一些人对此持有质疑态度,除了对AI生成的图片质量表示不认可以外,更多地忧虑出现在AI生成图像的逼真性所带来的假新闻问题。这种矛盾的观点促使我们进行了进一步的研究,以思考人们对AI生成图像的态度。 这是AI生成的,你怎么看? 我们进行了一项在线实验。实验分为两组,每组的参与者均为随机的社交媒体用户,他们会评价同一组图像,但是会被告知图像来源不同。 在第一组实验中,参与者被告知他们看到的图像是由AI算法生成的。在第二组实验中,参与者被告知他们将看到的图像是由人类摄影师拍摄的。然而,真实情况是,所有的图像都是由AI生成的(见下图)。通过这种设计,我们希望能够理解人们的评价是否会受到他们对图像来源认知的影响。 图为实验素材,均由AI图像生成平台Midjourney生成 实验的结果显示,当被告知图像是由人类摄影师拍摄的受试者,对图像各方面的评价质量会更高。受限于被试对象的代表性有限,以及研究可能的偏差,研究结果存在一定的局限性,但这个结果揭示了人们对AI生成图像的复杂态度。 从认知心理学的角度来看,人们对创作主体的认知不同可能导致预期的差异,实验显示,目前人们对AI图像的创作期待很高。普通的AI图像,可能会让读者感到预期落差,认为AI没有充分发挥其水平,对其内容质量的评价可能会较低。但当人们欣赏人类创作的摄影作品时,基于自身生活经验,会倾向于认为创作者在作品中倾注了时间和心血,是有创作者的情感孕育其中的,这种认知也往往会引起人们的共鸣。然而,这样的情感共鸣人与机器之间无法建立起来,因此人类对AI图像的评价更为“冷酷”,因为在人类看来,机器消耗的只是算力和电力,并无感情投入。 这种对创作主体认知的差异还会触发人类的社交机制。人类创作者具有AI无法复制的社会性属性。对于AI图像生成技术,人们经常会对比不同平台、不同模型以及提示词微调后的生成效果。但是一般不会将人类和机器放在一起比较,即便比较也仅限于一些技术参数,例如图片清晰度是否足够高、对焦是否准确,以及光影处理是否得当等等。这是因为两者在创作层面的认识论和方法论完全不同。人类摄影师会经常将自己与其他摄影师进行比较,此时比较的不是数据,往往是一种主体创造力之间的较量。对于那些并非专业从事视觉工作的普通读者而言,一张高质量的照片可能会超出他们自身的拍摄水平,这会使他们对照片的创作者——摄影师产生深刻的印象。在这种情况下,人们常常会由衷地赞叹摄影师的技术和才华,给予他们极高的评价。然而,当同样的照片被知悉是由AI创作时,人们往往无法对"AI摄影师"产生同样的感情反应和评价。 这反映了受试者与人类创作者的情感共鸣和社会连接的需求,这些AI目前都无法满足。人们欣赏一位摄影师的作品时,他们不仅仅欣赏技术的运用,更重要的是,他们欣赏摄影师的视角,以及摄影师如何通过自己的作品表达自我和观念。然而,当这个创作过程被AI取代时,作品失去了人的视角和情感,也就失去了人们对创作者的赞美和心理认同。因此,虽然AI可以创作出超出人类技术水平的作品,但它无法获得与人类创作者相同的认可和评价。 此外,考虑到具体的社会情境,AI图像生成技术在现阶段在某种程度上威胁到了人类的利益,这也会使人们对AI生成图像的评价降低。谈及威胁,首当其冲的便是画师和摄影师。今年年初,美国加州三位有一定影响力的画师牵头提起集体诉讼,他们在法庭上指控两大AI绘画品牌Stability AI和Midjourney以及艺术家平台DeviantArt。他们的主要指控内容是这些公司使用了LAION-5B数据集进行AI模型的训练,而这个数据集中包含了大量受版权保护的画师作品,但是使用这些图像进行模型训练并没有得到原创作者的同意,更没有对原创作者进行补偿。此外,这些公司还利用AI生成的作品开发了自己的付费应用程序,例如Stability AI推出的DreamStudio。对于原本就受到冲击的原创作者而言,这是不可接受的。然而,有评论者指出,虽然从道义上看,画师们可能站在有理的一方,但在法律上,他们想要取得诉讼胜利可能会非常困难。证明作品被抄袭和拼接需要足够多的证据,而对于AI生成的作品,即使能进行比对测量,也很难达到法律所要求的标准。 相对于画师,摄影师的境遇可能相对较好,受影响较大的可能是观念摄影和商业摄影。因为这两种摄影类型的形象性与现实真实性并无直接关联。因此,AI图像生成技术只要达到形象呈现的目的,便可在很大程度上替代它们,更重要的是这种替代在公众的情感接受范围之内。与之相对的是纪实摄影,其形象性与真实性紧密关联。使用AI创作纪实摄影作品涉及到的伦理与法律风险将大增。若仅将其作为一种尝鲜的玩具还在公众的接受范围内,但若是想以假乱真、混淆视听,势必遭到舆论的谴责和法律的介入。 从玩具到艺术,人类未来将如何使用AI? 尽管现阶段相对于人类创作的视觉作品而言,AI创作的视觉作品没那么受“待见”,但是这并不能阻挡AI图像生成技术的进一步发展和应用。这核心将有赖于人类将自己的主体意识注入AI。 媒介环境学研究传播媒介如何影响人的感知、感情、认知和价值,其代表人物保罗·莱文森曾提出媒介进化论的思想,保罗·莱文森认为,媒介技术其发展遵循“玩具-镜子-艺术”三个发展阶段。莱文森认为一种新的媒介初入社会时往往只是一种娱乐工具,常常在社会的边缘起作用,然后随着技术的发展,成为一种写实的工具,最后随着新媒介的组合而蜕变成为艺术品。该规律呈现了一种新媒介如何由边缘化的玩具逐渐进化成为大众艺术的过程,其辩证逻辑可以表述为“前现实—现实—后现实”。 摄影术的发展就是遵循着这样一种路径,1839年摄影术诞生之初,人们对这种新技术充满好奇,但是只是将其作为一种“玩具”对待,然而随着技术的不断发展和人们对个人图像以及社会图景的视觉需求,摄影术已经从最初的玩具步入可以创造社会生产力的“镜子”,商业人像摄影即新闻纪实摄影的兴起正是这一阶段的标志性产物,随着时间推移,观念摄影和艺术摄影的出现使得摄影术完成艺术阶段的进化。 当我们用这一视角来审视AI图像生成技术时,也是颇具启发性的。在“玩具”阶段,AI图像生成技术作为“意料之外的进化结果”仅仅是被一些爱好者作为玩具去对待,而且人们会更多关注AI技术本身的乐趣。然而,现如今,AI图像生成技术正处于一个由“玩具”到“镜子”的发展阶段,使用者开始进一步关注媒介所展示的内容,传达现实、与现实互动成为技术的主要作用。这种传达现实并非仅仅是纪实摄影所做的表征现实,而是呼应现实,介入现实,成为现实的社会生产力。现阶段人们已经开始使用AI进行一些内容产出,比如有设计师开始使用AI技术快速生成想要的背景和元素,电商开始使用AI快速生成各式各样的产品图,视频生产者也开始使用AI进行分镜头脚本的绘制……AI图像生成技术的生产力正不断被人们发掘并应用到现实场景之中。从技术理性的角度来看,AI图像生成的基础性算法已经成型,未来的无限可能蕴含在对垂直细分领域模型的微调之中。此外,作为传递人类意志重要载体的提示词,在这种新型人机交互关系中显得尤为关键。人类在未来使用AI的过程中,提示词的质量将成为重要变量,提示词工程师或将成为一个新兴的职业。这种人机交互方式也将在某种程度上影响人们原有的思维方式,当我们需要一张图像时,思考的内容不再是怎么画或者怎么拍摄,而是怎样描述才能使得机器更准确地理解自己的需求。 在莱文森看来,如果技术要实现第二阶段的飞跃,就应该反映现实同时更要超越现实,为人的生存、发展提供更加高效的策略,这便实现了“艺术”的演进。以我现有的理解能力来看,AI图像生成技术似乎在这一阶段有着天然的优势,因为其本身模型的训练便是基于大量绘画艺术、摄影艺术,再加上AI生成图像的过程在本质上是一个随机的推测的过程,当意想之外的不可控部分呈现之时,或许阴差阳错地就与人们的某种亦不可控的意识相匹配,从而成为超越现实但是又能够被人们解码的新型“艺术”。 那么摄影在这一轮的技术变革之中,将会遭遇怎样的冲击?在莱文森看来,人类需求和社会环境是推动媒介进化的重要因素。旧有的媒介也不会随着新媒介的兴起而衰落或消失,只要旧有媒介能够找到适应人类需求和感官的媒介生态位,仍然可以存活下来。对于摄影而言,人们对其纪录现实的需求是不变的,尤其在如今真假难辨的信息环境下,摄影的纪实性将为其争取坚实的生存空间。面对AI图像生成技术的迅猛发展,摄影的意义也在解构中得到重新建构。 文章首发于中国摄影报,经作者张树志确定后进行转载 |
原创栏目
影像热点
影像视频
IT百科
影像热词
网友评论
聚超值•精选