FLUX.1 Kontext是由Black Forest Labs开发的新一代AI图像生成模型家族,包含Dev、Pro和Max三个版本。作为首个支持多轮迭代编辑的模型,它在保持角色、身份、风格和特征一致性方面实现了重大突破。

简单来说,FLUX.1 Kontext突破了传统文本到图像模型的局限,支持文本和图像的混合输入。

比如,简单的文本提示词、草图或线条绘制、脚本摘录或视觉描述都支持。

而且,可以一轮一轮的优化迭代,迭代过程中,人物一致性、风格都能保持相对稳定。

此外,FLUX.1 Kontext在性能方面也有突破,推理速度号称比当前领先模型快达8倍。

今天,我们就来试用一下,在不同的应用场景,FLUX.1 Kontext的表现如何。

我是在下面两个有免费额度的地方试用的,基本上短期内可以一直免费用下去。

1、官方的试用网站 https://playground.bfl.ai/,每个注册用户有200个积分免费使用。

2、Runninghub https://www.runninghub.cn/,输入邀请码,可得RH币,基本可以免费用很久,人多时要排队。我的邀请码是:kebgl84g,有需要可以用。

换衣服颜色

衣服换颜色

可以看到,衣服换颜色,人物一致性保持的非常好,简单的一句提示词就可以实现。而且不用抽卡,很稳定,速度也确实快,几秒钟就出一张。

换服装

官方网站上的页面暂时不支持多个附件,如果需要,可以到Runninghub,通过Comfyui来实现,或者在官方把两个图片拼到一张图片里,不过我测下来,效果会打折扣。

下面,是在Runninghub上测的,使用了支持多图的工作流。

换装的Comfyui

结果并不是特别稳定,比如,让左边的人,穿右边的服装,一开始的结果是上衣换了,裤子没换。

下面这个换的就比较彻底,但人物貌似融合了一点点右边人物的特征。

换装的Comfyui

换装结果2

再来试试直接换人物,保留衣服,效果拉满。

换模特

换姿势

测试人物换姿势,试了一个“亚洲蹲”,结果没毛病。

人物换姿势

字体支持

官方试用网站暂时没做到对中文字体的支持,试了一个英文的。

英文字体支持

中文字体暂时可以通过图案的方式来实现,我是在官网,通过2合1的图来测试的,明显需要多次抽卡了。(图标是在即梦顺手生成的)

中文图案

换环境、背景、光线

环境变化时,光线效果明显不一样了,也是正常情况,人物还是保持了一致性。

换环境、背景

再来个更明显的,从白天变傍晚了。

场景光线变化

扩图

扩图效果拉满,人物也没变。

扩图

局部添加物品

抱个猫咪,貌似镜头拉近了一些,可以通过提示词精细化控制一下。

局部添加

不同风格的服饰、发饰

突然想尝试一个古装风格,这次简单提示词就不行了,不过,借助DeepSeek,把提示词具体细化后,还是可以的。

不知道为什么,镜头又自己拉近了一些。这个模型好像喜欢自己靠近。

古风服饰、发饰

同样的思路,再加码一些,把风格改为鬼怪玄幻风格,人物一致性,还是保持的很好。

鬼怪玄幻风格

提取衣服

主体的衣服可以提取的差不多,但配饰总是有些小问题。

提取衣服

复用字体风格

随便找了一个复杂设计的字体风格(上面),复用到新的文本上(下面),效果极好。

复用字体风格

有了这个思路,就可以收集好看的字体效果,以备未来使用啦。

光照环境改变

晚上变白天,这个光照效果的改变,很细节。

晚上变白天

风格迁移、转换

跨物种复用了一下绘画风格,“美女变恐龙”的效果是这样的:

风格复用

用左边男孩的风格,制作川普玩偶。

风格复用-川普玩偶

下面是风格转换(左1是原图,其他依次是吉卜力风格、折纸风格、写实风格),大家觉得人物一致性可以接受吗?

风格转换

多人物同框

前面提到过,官网试用版不支持多张附件,要么通过Comfyui调API用,要么需要事先把多个人物拼合在一个图里,这种情况,出图会打不少折扣,导致需要抽卡多次,人物一致性开始出现一点点小问题(下图里左边的人物)。

不过,已经很强了。

多人物同框


上面的一些小应用场景,基本都是通过接近自然语言的简单提示词来完成的。

而对于复杂场景的支持,FLUX.1 Kontext的效果也非常不错,只要你能把提示词细节描述到位。

比如,

下面这个是灵山脚下的白毛老鼠精的提示词:

Epic fantasy art, an ancient albino rat spirit in flowing white fur robes, standing at the foot of a colossal sacred mountain. Sharp red eyes, delicate whiskers, holding a glowing stolen prayer bead, misty lotus ponds and glowing spiritual fireflies around. Ethereal mist, golden hour lighting, intricate embroidery on robes, mystical atmosphere, hyperdetailed, Artgerm style, 8k resolution

灵山脚下的白毛老鼠精

还有,下面这个聂小倩的鬼怪风格海报:

聂小倩


总得说来,FLUX.1 Kontext这个模型,宣称的三个特点(人物和风格一致性、可迭代的指令提示词、高性能)确实是做得不错,对于非设计师人员,可以满足对很多业务场景的支撑。

以上,只是我简单测试到的部分场景,更多创意场景,欢迎大家一起讨论、测试。

谢谢看到这里的朋友,如果觉得上面的内容能有点用,还请随手点个赞/分享,支持一下!微信公众号【赛博效率师Moon】,只分享有价值的内容,我们下期见!