当前位置:首页 > 生活常识 > 正文

所有分辨图片的方法都是用人工智能制作的

  

  

  这篇文章是Lifehacker“揭露人工智能”系列的一部分。我们正在探索六种不同类型的人工智能生成的媒体,并强调常见的怪癖,副产品和标志,帮助你区分人工和人类创造的内容。

  AI艺术不再只是一个概念:它无处不在,你可能会在野外遇到它,不管你是否知道它。人工智能艺术获得了奖项(尽管存在争议),被用于Netflix电影(再次面临批评),并以婴儿、耶稣和蔬菜的虚假图像欺骗了无数Facebook用户。短期内不会有任何进展。

  随着生成图像的技术不断改进,学习如何识别这些人工智能生成的图像比以往任何时候都更重要,这样你就不会被别人的假照片所欺骗。对人工智能生成的一些鸭子的图像不假思索似乎是无害的,但当坏人通过人工智能图像传播虚假信息时,后果是可怕的。制作人工智能图像生成器的公司正在研究如何给人工智能生成的图像“加水印”,但我们还没有做到这一点。网上流传的大多数人工智能艺术作品都没有明确的标签,警告用户这些图像不是真实的。取而代之的是,这些技巧可以帮助你在这些虚假图片出现在你的信息流中时发现它们。

  我们很容易看到一幅AI艺术作品,并认为生成它的生成器只是将其数据库中的一堆图像拼接在一起。但这并不是真正发生的事情。

  AI美术生成器确实是在大量图像数据集(从美术到照片)上进行训练的。然而,这些工具不能像人类那样“看到”这些图像。相反,他们将这些图像逐像素分解。它看不到苹果;它将看到一组像素和它们的值。随着时间的推移,它将了解到这些特定像素值的分组倾向于成为一个苹果。在足够的图像和足够的背景下训练AI,它将开始在各种物体和风格之间绘制线条。它将了解如何一般渲染水果,动物和人,以及艺术风格,颜色和情绪。

  现代人工智能图像生成器,如DALL-E,使用所谓的扩散来学习和生成图像。从本质上讲,他们采用训练图像,并在图像中添加视觉噪声(认为是静态的),直到整个图像变得毫无意义。这个想法是为了理解在每一步添加噪音对图像的影响:从这里开始,它尝试相反的方法,从噪音中创建自己的原始图像版本,这训练人工智能从头开始创建图像。

  这是一个极其简化的解释,但重要的是要知道,这些生成器是利用一个巨大的学习关系数据库。这使得在几秒钟内渲染复杂的场景成为可能,但这也导致了一些奇怪的怪癖,这些怪癖可以帮助我们从真实的图像中识别人工智能图像。

  人工智能艺术正在变得越来越好,但它仍然不够完美。虽然这些工具能够生成具有逼真照明的高质量图像,但它们仍然难以处理较小的细节。

  也许最著名的是,人工智能艺术中的“人类”主题往往有错误的手指数量。也许这幅画的其他部分乍一看似乎很有说服力,但看看这些手,你会注意到每只手上有六根、七根或八根手指。或者正好相反,手有三根手指,其中两根变成了一根。无论如何,手指和与之相连的手经常乱糟糟的。

  但是,虽然人工智能最容易出错的地方是手指,但它的问题并不止于手。任何重复的模式,特别是当它涉及到人类的细节时,都可能被AI美术错误地生成。看一看照片中人物的牙齿:有时,牙齿太多了,或者看起来扭曲了,这是他们通常不会有的样子。我们大多数人都没有完美的笑容,但人工智能的牙齿在另一个层面上。

  你甚至可能会看到一个多出一条胳膊的人:当你看着一张照片,想知道它有什么不对劲的时候,突然你注意到这个人的第三条胳膊从他们的运动衫里伸出来了。

  Vox有一个很棒的视频,探讨了为什么人工智能会在这些重复元素中挣扎,但从本质上讲,这归结为人工智能缺乏经验。这些工具是在大量数据上训练的,但是当涉及到一些复杂的东西时,比如手,它所拥有的数据并不能为机器人提供足够的背景,让它知道如何正确和真实地生成元素。它不知道手是如何工作的——它只能从它看到的手上拉东西。我们正在经历知识的极限。

  看看足够多的AI图像,你就会发现一些奇怪的东西:物体到处都是相互融合和变形的。我已经提到过这种情况会发生在手指上,但它也可能发生在主体的许多其他元素上,包括牙齿变形成其他牙齿,衣服融合到自己身上,眼睛似乎流血到主体头部的其他部位。

  但不仅仅是主体:图像中的一切都是这种混合的公平游戏。请看下面我用DALL-E生成的图像。这款棋盘游戏是波浪形的,棋盘的一部分会变成其他部分,棋子会融入到瓷砖中。右边那位女士的牙齿都压在一起了,而另一位女士的毛衣袖口都叠在一起了。(更不用说,她的手指已经合二为一了。)

  毕业舞会

  pt:“生成一群朋友在玩棋盘游戏时互相微笑的图像。”图片来源:Jake Peterson/OpenAI

  人工智能也许能够生成文本,但它通常不能很好地在图像中书写。在许多情况下,包含文字的AI艺术看起来会很糟糕。有时,它是一个与现实世界相似的标志,但并没有完全实现。(你可以看出它想说可口可乐,但所有的字母都混在一起了。)其他时候,它看起来像是有人试图编造一种语言,或者是在梦中试图阅读一些东西的感觉。(事实上,很多人工智能图像给人一种梦幻般的感觉,至少对我来说是这样。)

  现在,人工智能艺术的这一方面正在迅速发展。戴尔- e和元人工智能都能够生成一个蛋糕的图像,上面写着“生日快乐,凯伦”,没有任何可怕的问题。也就是说,meta的拼写并不完美:“HAPPY”中的第二个“P”看起来更像一个“Y”,而“KAREN”中的“a”有两条线,而不是一条。但需要注意的是,当你特别提示人工智能将这些图像写出来时,这些图像的效果会更好:当留给它自己的设备时,文字通常看起来很奇怪,所以如果创造图像的人没有想过要修复它,那就很明显了。

  让DALL-E生成地图,它可以在一定程度上准确地生成地图,尽管它使用的是“人工智能书写”。图片来源:Jake Peterson/OpenAI

  说到底,AI美术其实什么都不懂。它是根据所有训练数据建立的关系来创作艺术的。它不知道建筑物应该如何建造,网球是如何打的,或者人的手是如何移动的。它从训练中汲取灵感,尽其所能地复制这些要求。如果你看得足够仔细,你会发现这些知识缺口出现在整个AI艺术作品中,特别是在有很多内容的图片中。

  以这张图片为例:我让DALL-E生成一个地下室聚会的图片,人们在玩啤酒桌球,用红色的Solo杯喝酒,聊天。马上,有一些主要的问题:画面中的人的眼睛大多是睁不开的;打啤酒乒乓的人的手坏了;为什么他要从桌子的一边扔乒乓球?说到桌子,它是波浪状的,扭曲的,这是真正的桌子所不会的,桌子的一边由于某种原因有两组杯子。

  看向背景,事情变得更加奇怪。一个男人跪在地上,喝着他的红色杯子,好像它是一个瓶子。他身后的那个人似乎在他的红色杯子里放着一个蓝色的罐子,好像杯子是一个怪人。他后面的人的脸似乎是ps过的,和拍摄对象一样模糊。

  毕业舞会

  pt:“生成一个ba的图像

  聚会:人们玩啤酒管,用红色的单人杯喝酒,聊天。”图片来源:Jake Peterson/OpenAI

  即使是制造这些工具的公司的官方示例也存在这些逻辑上的不一致。OpenAI在治疗师面前展示了一个鳄梨的有趣图像来展示dall - e3。

  信贷:OpenAI

  牛油果有一个挖出来的核,它正在向治疗师(一个勺子)抱怨内心空虚。这还算不错,但看看治疗师的记事本:他们是反着写的,书页朝外。戴尔- e看过足够多的治疗师图像,知道他们通常在什么工具上写笔记,但不明白我们人类通常写在纸上,而不是剪贴板上。

  当然,在Facebook等社交媒体网站上疯传的人工智能帖子通常毫无意义。谁在用奥利奥做猫的雕塑?为什么有那么多悲伤的艺术家在堆耶稣的沙堡?艺术可以富有想象力,但AI艺术尤其奇怪,无论是小细节还是大主题。

  在看了一段时间的人工智能图像后,你开始注意到一些奇怪的事情,尤其是在逼真的图片中:一切都是闪亮的。人工智能图像通常具有一些人所说的“人工智能光泽”,如果你知道你在寻找什么,这种光泽可以泄露图片的来源。照片经常过度曝光,或者以戏剧性的灯光为特色,这使得拍摄对象特别明亮。

  过了一会儿,你看到像下面这样的照片,立刻就知道它是用人工智能制作的,就像它看起来的样子一样。(即使实验对象的手也没有离开。)

  毕业舞会

  生成一幅逼真的女子拿着棍子的图像

  用两只手塞球。图片来源:Jake Peterson/OpenAI

  虽然这些建议在今天可能是相关的,但人工智能技术仍在继续发展和完善,可能在不久的将来,这些建议就会变得毫无用处。人工智能在写作方面已经做得更好了,所以谁敢说它不会每次都想出一种方法来生成逼真的手呢?或者阻止照片中的元素混合在一起?或者停止在图像背景中添加奇怪的东西?虽然上面的技巧目前对逼真的图像很有用,但识别人工智能生成的艺术品可能会更加困难:这些作品可能与上面提到的一样有缺陷,但更容易用“油漆”掩盖这些不一致之处,而“油漆”通常是混合的,不太真实,更容易解释。

  随着我们进入一个特别动荡的选举年,当你浏览互联网时,打开你的废话雷达将比以往任何时候都更重要。在你被某人复杂的艺术作品打动之前,或者被一张冒犯性的图片激怒之前,请三思:这张照片是真的吗?

有话要说...