聪明的东西
作者 |程倩
编辑 |心
距离农历龙年仅剩11天,你的新年头像或红包封面准备好了吗? 如果您还没有,AI 绘画工具可能是“私人定制”的不错选择。
提示词:生成龙年画像,一定要有喜庆的气氛,还能体现出运势和运势(第一排是文心一言、文心一格、360志华、阿里云通义万象、寻飞星火; 第二排分别是智浦AI智浦青燕、抖音斗宝、腾讯混元助手、美图奇迹视觉、科大讯飞星火绘助手)。
在过去的一年里,AI文生图模型不断进化,不仅掌握了各种绘画风格,还陆续解决了“红烧狮头”等绘制不佳、空间定位不理解、模糊或抽象概念不理解等各种难题。
虽然 Midjourney、Dall·e 3 和 Imagen 2 都不错,但它们有一定的使用门槛。 好在国内大型模型公司正在迎头赶上,发布一适合中国体质的AI绘图工具可及性与外国人工智能工具相距十条街。
这些工具都可用免费试用可以通过网页或APP使用,使用门槛之间的差距基本是分不开的。 拼出一代的速度,大概每个**都能进去半分钟内生成受网络环境或浏览器条件的影响,不可能很客观。
那么谁是国产AI文盛图工具的头号玩家呢? 谁是协助专业创作者提高效率,将绘画新手从水火中拯救出来的神器? 为了回答这个问题,我们研究了两个关键能力:理解力强和画得好。
出于这个原因,我在国内10 模型免费的AI文生图工具对比5个梯度进度的体验,试题包括但不限于:每日脑洞、网红表情包、头像设计、公司年会、春节氛围、跨界组合、诗歌领悟、多轮修改看看哪个工具更方便,可以在几秒钟内更好地理解用户的想法。
总而言之,智普AI的智普青妍是整体上最稳定的AI文生图工具,10次测试基本可以生成符合我要求的图像。
还所有员工轮流的考试题目也有一些,比如画的鹦鹉爪不仅形状怪异,数量也与真品不符; 看不懂现在火爆的“南方小土豆”,还把“捧着冰糖葫芦”的动作画进了串在一起的土豆里; 祝福字和春联上的文字写得像鬼一样,画着符号......
** 单词理解能力、志璞青妍、文心一言、讯飞星火、同义万祥、混元助手表现较好。 360奇迹视界和美图奇迹视界在面对第一个问题“阿拉斯加”时出了问题,莫名其妙地把阿拉斯加画成了人类北极熊。
在图片的细节水平上,志璞清妍、通义万祥、文心制作的春节氛围图,几乎可以马上用上; 春晚宣传海报上,直接点名了龙年的背景,通义万象、迅飞星火、抖音斗宝的吉祥物形象可以说与传统“龙”无关。
关于多轮修订的可靠性,文心一言是一个坚持每一轮都结束的选手,志浦清妍忠于之前的**修改,腾讯混元助手的表现可圈可点,有的每一步的需求都理解到位,有的还加入了一些奇怪的元素。总的来说,多轮修改是绘图和设计的必备技能,但基本上所有的AI绘图工具都做不到。
为了确保比较的公平性,我体验了每种工具的生成能力基于第一代**具体对比如下:
青铜难度第一阶段的提示比较简单,大部分都只包含2个关键词,包括生成中的主角,以及这个角色的地理位置、行为、大小、风格等关键要素之一。
第一个是“”。站在建筑物屋顶上的阿拉斯加“,主要包含对地理位置和阿拉斯加犬种的了解。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
分解这两个关键字,每个工具都通过比较周围的楼层或鸟瞰图来呈现“站在屋顶上”。 它们中的大多数还突出了主要特征,例如大型阿拉斯加犬、黑白配色方案和长毛。
但没想到的是,“阿拉斯加”,一个普通的犬种,竟然有一个完全不匹配的AI生成的图像。 美图奇迹视觉描绘了一只类似北极熊的动物站在建筑物的屋顶上,而360度奇迹视觉则描绘了一个站在建筑物屋顶上的男人的更离谱的画面。
第二个问题是生成”。一只粉红色的鹦鹉站在树枝上这个提示的关键词主要包括地理位置、粉红、鹦鹉。 这个问题的难点在于,鸟爪和人手一样,是困扰AI的问题,一些AI生成的鸟爪图往往有扭曲和奇怪的形状。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
果不其然,10款AI绘画工具全部翻车。 鹦鹉的脚趾是相对的脚趾,两个脚趾向前,两个脚趾向后。 但有的**把脚趾藏在树干后面,有的即使画脚趾,数量和位置也不对。
然而,这些AI图片都呈现出“站在树枝上,粉红色”的特征,一眼就能看出是鹦鹉,但经不起推敲。
放大**仔细观察,彤逸万象、科大讯飞星火、科大讯飞星火绘助手、美图奇迹视觉在鹦鹉眼的治疗上也出了问题,有的鹦鹉一侧有两只眼睛,有的眼球很小,完全失真。
第三个难题是”。“南方小土豆”是抱着冰糖葫芦的南方小土豆,是东北游客的昵称这个提示的主要难点是理解“拿着冰糖葫芦”和“南方的小土豆是游客”。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
从结果来看,有的土豆串在一起做山楂,有的直接把小土豆重新排列组合,有的直接动了土豆的形象。
其中,独树一帜的两款AI工具是科大讯飞,充分理解了“小土豆是游客”的概念,终于在10**中看到了真实的形象。
但没想到所有的冰糖葫芦都翻了,只有芝浦青妍的**形象串在一根木棍上,上面串着几颗红色的水果,与冰糖葫芦略有边角。
青铜挑战赛的最后一个问题是,“.蓝白瓷风格的彩绘冷杉“,则指定了 ** 样式。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
这个问题的结果之间存在很大的差距,例如在青花瓷上画杉木,在杉木上画青花瓷图案,以及使用青花瓷对应的线条颜色。
虽然前两者结合了青花瓷风格和杉木两种元素,但仍然没有准确理解。 其中,通仪万象、志浦清彦、腾讯混元助手甚至可以直接使用,青花瓷风格直接融入到画中。
然而,在志璞清妍的画中却有一个小虫子:杉木被画成一棵松树。
* 阶段提示词难度增加,关键词数量从2个增加到5个以上,需要理解关键词描述。
第一个问题的标题是适应即将到来的春节,这样就生成了AI绘画工具”。春节气氛浓厚的**需要包含灯笼、春联、祝福字除了美图奇迹视觉,其余的**都体现了春节的热闹气氛。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
为了稍微降低难度,好让自己快速找到**中对应的元素,这道题只设置了“灯笼、春联、祝福词”三个明确的关键词,但最终结果并不完美。
芝浦青燕和抖音豆包完全保留了三要素,但汉字的呈现还是个大问题。 志浦清妍的**几乎看不清“福”的轮廓,抖音豆包的春联和福字都是一堆乱码字。
其余工具生成的**大部分只包含其中的1-2个,而通义万象、迅飞星火、迅飞星火画助手、腾讯混元助手春节气氛非常浓厚,整体画面看起来非常和谐。
第二个问题中的关键词数量直接翻了一番,包括“.饺子、美食、热气腾腾、色彩柔和、高饱和度、美食摄影、诱人、定焦、超清
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
起初,我以为这个谜题的门槛会在一长串预选赛中呈现,没想到它直接从“饺子”开始翻盘。 抖音豆包子、寻飞星火、寻飞星火画助手、通仪万香、志浦青妍都看作地道的饺子,其余的都直接“变异”成了包子。
第三个问题有困难,”当一个公司召开年会时,在**的右上角,需要有一个带有年会主题的横幅有必要在指定位置绘制年会横幅。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
在体现氛围方面,这些AI工具画得还不错。 然而,360智能画的**、通益万象、美图奇迹视觉并不理解“年会”这个概念,而是直接省略了“年”字,催生了大家的**。
在这个问题中,我没有非常精确地指定横幅的位置,而是含糊其辞地说“右上角”。 从位置来看,抖音豆袋、迅飞星火、迅飞星火画助手都有横幅和主题,但都是在屏幕的正上方,在志浦清烟的右上角有横幅和标语元素。
* 舞台的最后一个谜题是,“.今年是龙年,要为春晚画宣传海报,就需要有吉祥物
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
春晚的吉祥物传统由来已久,龙也是中国传统文化的典型代表形象。 有龙头像、小恐龙形象等,有的甚至完全脱离了龙的传统含义。
从最终的画面效果来看,除了芝浦青燕的**,有宣传海报的边框等,其余大部分都只有一个吉祥物形象和背景。
*难度不仅考验AI绘图工具的想象力和创造力,还考验一些误导性提示的识别。
第一个标题为“.两个机器人手拉手登陆月球的四格漫画四格漫画想测试一下AI绘画工具是否能呈现出四张相互关联的图片。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
从结果来看,虽然单单无法理解四格漫画所呈现的具体故事,但相似的人物、人物动作、背景变化都显示出连贯性,其中最具代表性的AI绘画工具有志浦青燕、抖音斗宝、美图奇迹视觉。 虽然360智能绘图生成的**也呈现出四格漫画,但更像是一个人类登月的故事。
其余工具直接忽略关键词“四格漫画”,只反映“两个机器人手拉手”登月。
第二个问题更是荒谬可笑“蒙娜丽莎来中国申请成为一名程序员需要AI绘画工具来体现蒙娜丽莎、中国和程序员的三个要素。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
文心一歌、讯飞星火、讯飞星火画助手直接将蒙娜丽莎的经典形象与电脑相结合,文心一言、360知华、阿里云通益万象、志浦清妍、混元助手被完全再现,前三个生成的**可能是为了契合中国元素,看起来更像中国人。 志璞清妍的形象更接近外国人的形象,也是唯一一个体现“应用”的**,混元助手自己采用了漫画风格。
抖音斗宝和美图奇迹视界直接将《蒙娜丽莎》的原图移到了**,但调整了背景**,却没有让我一眼就明白自己想要体现的关键元素是什么。
第三个标题是“AI绘画工具挖了一个大洞,”一条名为“松鼠鸳鸯鱼”的鱼成功跳过了龙门AI需要避免“松鼠鸳鸯鱼”,准确获取不是重点。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
“松鼠鳜鱼”的问题还是骗过了1 2的AI工具,但好在之前的“松鼠跪在鱼前”的乌龙没有再出现。 迅飞星火的**体现了“鱼跃门”,而芝浦青岩则包含了“龙”和“门”。 美图奇迹视觉更是简单粗暴,直接在中间打出鱼的名字,配上文字。
最后,钻石难点是融合了中国古代智慧的古诗理解。 一般来说,古诗的寥寥几字背后蕴含着与社会背景、人物、古诗等相关的意境,所以不仅需要AI来理解诗歌,还需要结合古诗的语境。
为了一步一步地走,AI绘画工具一开始收到的诗歌都非常生动,有突出的物体和环境描述。
第一个问题是“.角落里有几株李子,凌寒一个人打开了从句子含义的拆解来看,是角落、梅花、冷、开放的关键词。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
除了美图公司的MiracleVision走了不同的道路外,其他工具都以“梅花”和“凯”为主体。 文心一言的画作旁边也有诗篆,更符合古诗带图画的风格。 文心一格、通义万象、志浦清妍、迅飞星火、迅飞星火画助、腾讯混元助教,画面上都有雪花,映照着“凌寒”。
芝浦青岩的梅花在角落里,但从外面看,更像是一堵现代的墙,与古诗所暗示的年代不符。
古诗的第二个问题”。黄河的水从天而降,奔向大海,再也没有回来画面也很强烈,但与梅花不同的是,这首诗中的“黄河”有一个指定的对象。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
美图奇迹视界依旧直截了当,诗句放在**的中间。 抖音豆包子、文心一言、文心一格、阿里云通益万象**对于黄河的呈现更加逼真,体现出“冲海”的气势。 志璞青妍、科大讯飞星火、科大讯飞星火的绘画助手更注重呈现“黄”的元素。
360智华虽然能感觉到黄河,但河面太过平静,没有奔腾的气势。
最后一个问题”。但世界之王,在他死前和死后都赢得了这个名字难点在于画面感不强,AI无法直接从字面上获取诗歌的主要对象。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
从AI绘画工具生成的**可以看出,大部分工具都以“王者”为主体**,而通义万祥是一座大宫殿,从侧面也体现出王者。 然而,温辛一言和温欣一格呈现的是女性形象,这似乎与古诗的字面意义无关。
美图奇迹视觉无法从此提示生成**。
什么时候会”。醉醺醺地拿起灯看剑,梦回吹号角连营。 八百里火,五十弦翻转外界,战场上是秋兵。 马制陆快,弓如霹雳。 但世界之王,在他死前和死后都赢得了这个名字可怜的白色发生了! “整首诗以提示为用,AI绘画工具生成**,更符合古诗本身的意境,具有战场上将军的形象。 但是,美图奇迹视觉仍然无法生成。
第一排左起:文鑫一言、文心一格、360智华、阿里云通义万向、智浦AI智浦清妍; 第二排左起:抖音斗宝、科大讯飞星火、科大讯飞星火绘助手、腾讯混合助手、美图奇迹视界
其中,左下角有芝浦青岩的诗句,比较符合古诗带图画的风格。 360志华和阿里云通义万象**中只有一个大体形象,无法反映出更宏大的景象。
每个设计师的设计稿都有n个版本,所以如果你想让AI画出一个我满意的**,就需要反复要求。
不过,这个环节只剩下三个竞争对手:文心一言、志璞青妍、腾讯混元助手。 其余的工具退出了比赛,因为它们不支持多轮对话。
第一个问题是春节气氛图的提示词的延续,其中许多AI工具都失败了。
这一次我变得更加难度,对AI工具生成的**更加挑剔,在让它们产生浓郁的春节氛围后,包括灯笼、春联、祝福人物,我不断提出新的修改要求,包括“画面更逼真”、“人多了”、“画面里还有人放鞭炮”, 等。 输入到所有 AI 工具中的文本完全相同。
文心一言生成的四张图片中,除了对“写实”二字缺乏理解外,其余的改进都非常符合我的需求,可以看出下一张图片基本没有偏离上一张的整体风格。
与文心一言相比,四张图片中,志浦清妍可以明显感觉到,同一张图片的内容在逐渐增加,但也在“写实”的部分,最后三张图片依旧是**,动画风格。
腾讯混合元素助手的四幅画面可以用风格迥异来形容,每一张都是在之前所有需求的基础上再现的,但对于“现实主义”的理解,混合助手也更胜一筹,最后三张明显感觉更真实。然而,在最后一张照片中,混元的助手把“鞭炮”画成了“烟花”,无法查出鞭炮在哪里。
第二个问题也是许多AI绘画工具将饺子变成包子的试题要求的附加版本。
在让每个AI工具画出一个新鲜出炉的饺子**后,我陆续提出了“让这盘饺子蒸”“多几盘饺子”“旁边多几道菜”“旁边一家人吃这些菜”等修改要求。
一共五轮对话,只有文心依妍坚持到最后,志璞清妍加了几道菜都没能加,跟我说还没构思,可以换成其他需求,混元助理只坚持到饺子蒸了,才回答“这个问题我还没学会怎么回答呢。
不过,乍一看,下字的前四张图片差别不大,虽然第四张图片勉强能看到饺子周围多了几个碗,但这些更像是蘸碗。 上一张卡的气氛还算不错,但是没有和之前的版本相比有所修改,相当于把这张牌都翻了一遍。
虽然志浦青妍只有三张图,都按要求改了,但还是和之前的问题一样,最后饺子都变成了包子。 志璞清妍生成的每张图片,也都自带了对**的理解和解释,比如,在第三张图片中,它提到“中间是一盘热气腾腾的新鲜出炉的饺子,周围是几盘其他各种中国菜。 这些菜肴包括蔬菜、肉类和米饭,代表了传统的中国餐。 这使我能够根据其对需求的理解再次提出更改建议。
腾讯混元助理的两张照片,不仅把饺子变成了包子,还莫名其妙地在中间放了一盘辣椒。
第三个问题比较令人困惑,我试图让AI理解狗和狗忽略发髻之间的关系。
我先让每个AI工具画一桌天津勾宋包子,然后要求把图片改成“狗狗在吃勾宋包子”,让它把狗的颜色改成黑色,把**改成漫画风格。
文心依妍前两轮表现很不错,狗狗都无视包子和狗狗,但最后两张图让我大吃一惊,黑包子真的难得一见,第四张图包子“露”了,有一种产生烤麦子的感觉。
茹璞青妍的四张图,我要求它修改的细节都覆盖得很好,美中不足的是,为什么包子一个接一个地变成了馒头、汉堡包和一大块面包?
腾讯混元助理直接把狗狗放在了包子盘的中间,但狗狗的颜色确实变了,最后两张图中的包子也变成了汉堡包。
从我对国产10款AI绘画工具的深入体验来看,AI在生成一些氛围感强且没有特定包含元素的**方面表现更好,但是一旦指定生成狗、包子、饺子等特定对象,就会出现奇怪的**。 不过,说到春节的气氛,或者是青花瓷的风格,需要AI独立创作更多的画面,往往会给我带来惊喜,有的甚至可以马上用上。
一开始,AI绘画工具因为对松鼠“跪”鱼、车马等的奇怪理解而惹出了很多麻烦,但现在随着它们的图像生成效果越来越逼真,细节也被描绘出来,我对这些工具的印象也发生了很大的变化。
然而,对于更有经验的画家来说,人工智能在描绘物体时犯错的问题是致命的。 当人们想用AI为书籍和宣传海报生成图片时,非资深人士很难发现AI生成的鸟爪和动物形象是否符合客观情况,如果海报上的文字和吉祥物形象一下子看不懂,或者存在一些不合理的内容, 沟通效果会大大降低,所以这也是我希望下一步AI绘画工具需要改进的地方。