在OpenAI的SORA占据主导地位一周后,StabilityAI上周还发布了一个新模型StableDiffusion3(以下简称“SD3”)。 该模型在生成图像质量、多主题提示、文字书写效果等方面迎来了革命性的提升,成为StabilityAI“最强大”的文盛图模型。
告别胡言乱语,更准确地呈现文本。
在上图中,SD3模型不仅生成了虚拟与现实、自然光影与视觉舒适画面的结合,还精准地写出了“不成功就成仁”的英文,改变了大众对之前文盛图模型难以输出文字的印象。
2.对物理规律有更准确的理解。
从官方示例图片来看,SD3模型似乎在努力成为古希腊初中物理之神,还原了提示“一匹马优雅地站在彩色球上”所描绘的场景。
3、提高多主题提示能力。
现在用户还可以一次输入多个主题提示,在过去,如何准确还原多个提示词对象的属性和位置,是文盛图模型要解决的难题,从官方效果图来看,目前的SD3已经能够理解多个提示词的元素,比如“宇航员, 簇绒的猪,粉红色的雨伞和知更鸟”。
在好奇的潮流下,有网友使用相同的多主题提示词,通过其他几个AI文生图的模型生成图像,展开了一场卷王之战。
4、生成效果质量更高。
与之前的版本相比,SD3生成的图像质量有了明显的提高,例如,上图显示了“黑色背景上的变色龙特写”产生的图像,这也符合期刊杂志。
5.增加了图像转换等新功能。
此外,Stability 的创始人还表示,首先,SD3 模型还支持使用文本来修改图片的内容,并精确控制图像中的每一个元素,包括替换和删除。 其次,图像无缝传输,没有任何改动痕迹的“嫁接”让人惊叹不已。
这些功能的不断改进,得益于该模型采用了与SORA变压器技术相同的架构和流量匹配技术,虽然从发布时间上看似乎有一种“既然要滚,就滚麻”的匆忙,但新技术的使用也是较早的决定,这个架构也和去年的SORA一样**。
据悉,与SORA一样,SD3尚未完全开放,该公司CEO表示,未来将根据用户反馈开源该模型。 但就算还没打开,也已经有不少网友表示,自己的电脑配置几乎无法忍受。
英信RTX 4080 SUPER Metal Master系列可加速您的制作和创作体验。 搭载全血版AD103-400核心、16GB GDDR6X超大显存和*** Tensorcores,第三代RTCres,其专业生产力和游戏性能都达到了无可挑剔的水平,在TensorRT插件的加持下,AI显卡的制作效率也能瞬间提升。