这两天,不少人开始拿到 Adobe Firefly 的测试资格。
虽然 3 月下旬才刚刚杀入,但作为设计界权威公司的新 AI 工具,它的生成效果也自是被寄予厚望。
这不,英伟达 AI 研究科学家 Jim Fan 率先给出实测:
Adobe 能否与自筹资金的 11 人团队 MidJourney 相抗衡?
结果是 ——
嗯,Adobe Firefly 被吊打了……
不信你看:
Adobe Firefly 大战 MidJourney
Jim Fan 一共测试了 8 轮。
第一轮:
死侍在英国一所公寓大楼外的汽车顶部摆出广角姿势。
来看两者的生成结果,左边是 Firefly,右边 MidJourney(下同):
啊这,Firefly 你确定左边这个是蜘蛛侠,而不是真・猪猪侠?
第二轮:
一张照片捕捉到超级马里奥在昏暗的街道上摆 pose,在地上的水坑里有一个大倒影,空气中有轻微的薄雾,你知道某些事情即将发生,人们对此充满期待。这就像好莱坞电影中的场景,高产值,拟人化的镜头。
结果:
超级马里奥的形象就不说了,感觉 Firefly 在背景和氛围感的刻画上也逊色一番。
第三轮:
和第二轮的提示词一模一样,不过把超级马里奥换成皮卡丘。
除去皮卡丘形象不说,还是 MidJourney 更能抓住氛围,Firefly 这次连昏暗的街道都表现得不到位。
第四轮:
不整 IP 形象了,这轮看看谁更擅长人物摄影。
富士胶片拍摄的这张现代街头风格的照片捕捉到了东京一个忧郁的早晨,一大群通勤者在街上行走。
人群中注意力集中的面孔穿着日本街头服饰和商务装的混搭,但吸引你注意力的是穿红色衣服的女人。
日出的温暖光芒在薄雾中绽放,而锐利的阳光和精心的构图强调了人群的情绪和红衣女子的优雅。
完全两种不同的呈现方式,但 Firefly 实在实在是有点失真了。
第五轮:
这轮再整点科幻的。
抽象分形艺术作品,由数百万个三维异形块组成的圆形马赛克城市建筑,城市位于太空中,背景可以看到木星,就像从宇宙飞船上看到的那样。
感觉 Firefly 对“圆形”的理解过于表面,显然也不懂什么是“像从宇宙飞船上看到的那样”。
第六轮:
现在来生成一些手机应用程序的图标设计,Firefly 知道这是什么吗?
应用程序图标设计:iOS,科幻星球景观,skeomorphic 风格;视觉技巧:使用浅景深、高曝光度、柔焦来强调美;设备:采用高分辨率相机拍摄;编辑:通过颜色校正和锐化增强;平台:Dribble、Behance
显然它还不知道。
第七轮:
报刊 / 电视台 / 新闻风格的照片,中全景,afga vista 剧照,一位留着白色辫子的牙买加年轻女子站在沙漠中,身穿复古亮片 Gucci 白色礼服。
这轮主要是看一下 AI 最不擅长的手部生成。
乍看一眼,两个都还行,但稍微瞧瞧就会发现 Firefly 给了个男扮女装的形象,手部废了,背景相比 MidJourney 还是输了一截。不过两者这个“白色辫子”的呈现就大哥不说二哥了。
最后一轮:
Seealpsee 湖旁蒲公英中的红色法拉利 F40,用 Fujifilm Velvia 50 拍摄,高细节,高对比度 4k
乍一看也都还行,但细看 Firefly 的背景还是假,不过 Firefly 说画蒲公英就只画蒲公英,MidJourney 反而画蛇添足给了一些其它花种,略微偏离题意。
测试就是这些,总体看下来,Firefly 确实完败,有种小学生 VS 大学生的赶脚,也有网友认为 Firefly 的水平也就算 MidJourney 的 V1 版本。
不过如 Jim Fan 所说,这种情况情有可原,毕竟:
(1)这些提示语已经在 MidJourney 中进行了大量优化,直接和刚“出道”的 Firefly 来比不是很公平。
不过 Jim Fan 也试了一些“变体”,但仍然无法获得更好的结果,也可能是和他写的提示词不是很好有关,上面这些测试的提示语基本来自网友。
(2)最重要的一点,Firefly 宣称它仅在 Adobe Stock 和完全许可的图像上接受过训练。
这点是很大的劣势,但对于必须确保输出图像版权的使用者来说却是一个重要的优势。因为这些人很可能更愿意为了合法性而牺牲质量。
针对这个话题,Jim Fan 进一步发表观点:
恕我直言,从长远来看,MidJourney 的策略(几乎不关注艺术家和版权)和 Adobe 的策略(为了保护知识产权削弱训练)都不是最优的。
也有一些还不错的作品
事实上,随便在网上搜一搜,还是能看到 Firefly 在没有如此对比之下生成的一些还不错的作品。
算是挽回一些局面。
比如这个:
走在鹅卵石路上的阿尔巴尼亚老妇人。
这个:
这个:
以及用它添加的动画效果:
能感觉到,Firefly 不擅长写实,这种卡通 / 手绘等效果还是可以。
Midjourney 更新:能以图生文了
强大的 Midjourney 仍在继续迭代。
官方最新发布一个命令:/describe,可以用 4 种文字结果来描述一张图片。
网友纷纷表示:我们可以用它给的描述来研究怎么更好的写提示词了。
不过,直接用它给出的描述再生成图,会跟原图有些差别,比如设计美学博主 @Simon_阿文尝试的这个“地铁老人看手机”梗图:
但很快就有网友给出解决方案:
除了手动再修改提示词,在二次生成时将原图也喂给 Midjourney 就会基本差别不大了。
参考链接:
-
[1]https://twitter.com/DrJimFan/status/1642967379939573761
-
[2]https://twitter.com/midjourney/status/1643053450501169157
-
[3]https://weibo.com/1757693565/MAuOMcoUO?pagetype=homefeed
本文来自微信公众号:量子位 (ID:QbitAI),作者:丰色
最新评论