近期涌现了许多强劲的生图模型,比如 Nano Banana Pro。但在最近的测试中,我发现,尽管这些模型非常强大,却无法生成透明背景的图片,甚至连简单的背景去除功能也无法完成。

如图所示,生成了假透明背景...

这个问题其实存在很久了,L 站就有相关帖子讨论,例如这个,但是没有大佬开源真正的方案。

产生这个问题的原因有 2 点:

  1. 一些中转站提供的只有 jpg 格式,背景怎么也不可能透明
  2. 上述帖子中有个人的解释很有道理,

Banana 生图通道没有 A 通道,因此无论 Gemini 如何理解透明的概念,它也无法生成真正的透明图片。不过,同输出为 PNG 格式下,其友商 GPT 模型就做到这一点,所以 Google 要加油了!

如果非 Banana 不可,一个可以替换的的方法就是让它生成与主题颜色都不相同且强烈的背景颜色,例如

至于什么是颜色不同且强烈的颜色呢,那就让 AI 给你判断,直接让它生成和主题颜色都不相同且强烈的背景颜色

然后再用下面的颜色去除工具,我不太建议用现在网上搜索到的一些所谓的 AI 智能抠图功能,因为我试下来,它们用的 AI 真的好智障,不如直接古法像素替换

当然对于一些图片来说,不是百分百有效的,但我们可以让 Banana 继续改良主题结构,让这个颜色去除工具发挥更大的作用。

我将这个工具代码开源在 Gist:

https://gist.github.com/dyedd/9c87ddfc3429f5658ee021346883e0a6

欢迎 star ↑

最终就能得到这样透明背景的图片了: