AI绝对可以称得上是近年来最热门的话题。自从阿尔法围棋击败顶级围棋选手后,越来越多的人意识到,在很多领域,AI已经能够用类似人类的思维更高效地完成任务。在很多领域,AI甚至可以涉及甚至部分取代以前只能由人类执行的工作。比如有了AI加持机器翻译,翻译的质量在很多场景下都达到了可用的水平,计算机和互联网也变得越来越智能。
AI加持翻译GNMT比之前的PNMT更接近人工翻译。
但是,长期以来,很多人仍然认为一些体现人类原始思维的领域仍然是AI的禁区。比如艺术和绘画,很难想象AI能比肩人的想象力和手艺。
然而这几年AI在图形学上的进步让人惊呼时代真的变了!许多高质量的AI绘画方案相继问世。即使你根本不会画画,用几个涂鸦甚至一两句话甚至几个字的简单描述,就可以通过AI生成漂亮的画。就像黑科技,尤其是最近在Google Colab开源的Disco扩散。全世界都在玩疯!
迪厅扩散已经可以画出这么高质量的图了!
AI画画不是一蹴而就的。随着计算能力的增强和算法的改进,逐渐修炼到现在的功力。那么近年来有哪些令人印象深刻的AI绘画方案?今天我们就来介绍一些值得玩味的AI绘画,看看AI是如何在艺术领域一步步挑战人类的。
Paintschainer,这可能是最早的AI绘画方案。Paintschainer早些年就引起了人们的注意。它不能完全自己画图。Paintschainer的主要功能是给线条画上色,效果已经可以赶上一些粗糙的人工上色作品了。
Paintschainer GitHub主页:https://github.com/pfnet/PaintsChainer
Paintschainer Demo:https://petalica-paint.pixiv.dev/index_zh.html
Paintschainer当时突然就火了,因为人们突然发现AI居然能认出线稿的内容!Paintschainer的神奇之处在于它可以识别线条稿的内容,比如一个漂亮女孩的画像。它可以识别出有些部分属于皮肤,有些部分是头发,有些部分是衣服,有些部分是背景,然后涂上合适的颜色。不仅如此,它的上色范围还挺准的。虽然线稿没有闭合,但是颜色还是会保持在适当的范围内,不会涂满一地――用过PS里油漆桶工具上色的朋友应该知道这是什么意思。
ai可以为电脑分辨抽象线条画,并自动上色。
使用简单的彩色线条进行颜色指定ho后,上色更加准确,效果甚至可以媲美手工上色。
在很多人的固有认知中,计算机很难“理解”图像,很难从照片中识别和总结出内容是什么。然而,Paintschainer达到了更高的水平,能够“理解”线条画等图像,这些图像比现实照片更抽象。虽然Paintschainer并不完美,但它足以让人们对AI的力量有一个更恰当的体验。
NV GauGANNV是显卡界的赢家,无数游戏玩家视老黄为偶像。NV也是AI算力的重要贡献者。它早早就在AI领域布局了很多棋子,如今NV在AI领域无论是硬件还是配套软件都达到了很高的水准——游戏玩家如果用过DLSS AI算法用NV提升画质,一定深有体会。
DLSS并不是NV在图像人工智能领域的唯一体现。其实NV近几年的开源AI项目SPADE/GauGAN就很厉害。
NV SPADE GitHub主页:https://github.com/NVlabs/SPADE
NV GauGAN 2 Demo:http://gaugan.org/gaugan2/
GauGAN是NV利用AI生成图像的一种方案。与上面介绍的线描上色AI相比,GauGAN的强大之处在于它可以生成完成度极高的图像,而前提是你只需要涂上几笔,用不同的色块和线条来表示它,让GauGAN明白你的意思,给你一张保真度极高的照片。
>而GauGAN一直处于发展中。今年,GauGAN还推出了第二代,除了依然可以通过简笔画生成照片,现在还能够通过文字描述来生成图像了!
在GauGAN 2当中,用户只需要输入描述画面的文字,AI就可以自动生成对应的画面。而且,生成的速度非常惊人,几乎就是即时的。例如下图,输入“Ocean”出现海,继而输入“waves”则会出现波浪,继续输入“hitting rocks on the beach”则又继续生成海滩和岩石,效果非常惊人。
此外,GauGAN还支持用户手动涂抹修改。如果想要对生成的内容做调整,就可以直接用简笔涂鸦,AI会如魔法般变出逼真的对应内容。
GauGAN之所以有如此大能,是因为使用了对抗网络,大量数据经过机器训练后,使用生成器和鉴别器来识别对应元素,从而匹配数据生成图像。据了解,GauGAN 2使用了1000万张图像进行训练,艺术家使用它不仅可以生成现实的风景,还可以生成天马行空的艺术场景,这超越了很多人以往对电脑插手艺术的固有印象。
Disco Diffusion
这可能是今年最为人瞩目的绘画AI了!Disco Diffusion一经面世,就刷爆了全球各大社交媒体,它颠覆了很多人对AI的认知。
你敢相信,这是AI作出来的画?
如果说GauGAN的强大之处,在于可以凭借人的简单想象就生成逼真图像,那么Disco Diffusion就更进一步,不仅可以进行复杂的想象,而且还可以生成各种画风的绘画!
Disco Diffusion是一个运行在Google Colab上的AI,如果要使用它,需要拥有Google账号并且能访问Google,国内的用户可以自行解决这方面的问题。Disco Diffusion的程序是面向公众公开的,在使用之前,我们可以先将其保存到自己的Google Drive网盘,以方便进一步的编辑。
Disco Diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
Disco Diffusion GitHub主页:https://github.com/alembics/disco-diffusion
Disco Diffusion的强大之处,在于你给出一段描述文字,就能够生成高质量的画作。尽管它没有图形界面,但使用起来并不复杂,进入到“Setting”当中,可以设置名称(AI生成的绘画会保存到Google Drive中对应的文件夹)、尺寸(不要设置太大,保持默认即可)、步数(保持默认即可)等等。
接着,进入到“Prompts”(提示词)的设置当中,这就是最关键的地方了。在Prompts中,你可以输入描述绘画的词句,例如官方给出的实例为“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme””,意思大致为“奇异灯塔的美丽绘画,在汹涌的血海中闪耀着光芒,参考greg rutkowskiThomas kinkade的画风,以及artstation网站上流行的风格”“黄色主调”。
然后点击“代码执行程序”中的“全部运行”,静静等待即可。运算过程可能长达几十分钟乃至数小时,运算是在Google的云服务器上运行的,对本机电脑性能没要求。随后,Disco Diffusion就生成了这样一副绘画!
在很多人眼里,AI能够生成这样的一幅画是非常惊人的,其完成度甚至不属于一些真正的画手。而Disco Diffusion生成这样的一幅画,流程要比手工作画来得更快,而且改一下提示词,又能生成另外不同风格的画了。
同样的Prompts提示词,仅仅更换了作者风格的关键字,Disco Diffusion就可以生成不同的画风
Disco Diffusion对提示词的要求很宽松,完全可以用简单的词语,甚至是机翻来应对。例如笔者填入了“a modern city at night,super wide angle,artstation”这样简单的Prompts,就生成了下面这幅画作。
Disco Diffusion有很多潜力可发掘。例如使用算力更强的云服务、设置更多次的迭代算法、提供更具体的提示词、甚至给到参考图片,都能够生成更高质量、更多种风格的画作。下面是一些来自互联网的利用Disco Diffusion生成的作品,大家可以感受一下。
Prompts:TheVastViridescentHillsidelacksRationalityandobfuscatesitsBeauty
Prompts:whenyouhavetakeneverythingaway,whatremains?willyouwalkthisroadallthewaytotheheartofthegalaxy?
Prompts:forbiddenaesthetic
毫无疑问,Disco Diffusion的出现,颠覆了很多人的三观。这个AI所生成的绘画,甚至已经可以说拥有一定的艺术感了。尽管它对于动物和人物的绘制仍存在短板,而且也并不能胜任人物、场景设计这样具体的、需要扣细节的工作,但无论是给普通人一场视觉盛宴,还是给行业人员找找灵感,都已经绰绰有余了。
可以说,Disco Diffusion将绘画AI推向了一个新高度,绘画这种讲究审美、讲究灵感的技艺,也不再专属于人类了。
Tiamat
Disco Diffusion依托在Google Colab上,对于国内用户来说有网络方面的门槛,而且界面说不上易用,还需要用英文来撰写提示词(尽管可以机翻)。现在,对国人更友好的AI绘画方案,正在路上。
最近,一款名为Tiamat的绘画AI在国内展开了测试。根据内测者微博用户 @春卷 的体验反馈,它的界面比较友好,而且可以用中文来给AI命题,效果还相当不错。
和Disco Diffusion相比,Tiamat的本土化做得好很多。例如,它甚至能根据诗词来绘画,画面效果相当好,还颇有意境。在微博、小红书平台上,都可以找到很多这样的案例。
Prompts:天苍苍,野茫茫,风吹草低见牛羊(来自微博 @春卷)
Prompts:海压竹枝低复举,风吹山角晦还明(来自小红书 @青柑普洱不甜_Tiamat)
Prompts:帘卷落花如雪,烟月,谁在小红亭(来自小红书 @5+1=6)
可见,Tiamat的AI方案还是有吸引人的独到之处的。不过目前Tiamat目前仍处于内部测试阶段,如果想要亲自体验,可以通过下面的链接来申请测试资格。
Tiamat内测申请:https://tiamat-ai.feishu.cn/share/base/shrcn2uXL8wNiveykIFYqWSzsPf
希望Tiamat能够尽快推出公开的版本,让更多国人感受到AI绘画的魅力吧。
总结
随着硬件性能的进步以及算法的改进,AI仍在飞速发展。AI在绘画方面的建树,已经让人咋舌,大家有条件的话,强烈推荐把玩一下Disco Diffusion,感受AI作画的魅力。未来AI会在更多方面挑战人类的灵智吗?我们拭目以待吧。