距离Google发布上一代AI图像模型已经过去三个月,考虑到AI发展的飞速步伐,我们早就该迎来新的更新了。Google没有让我们失望,在二月底推出了Nano Banana 2。
乍看之下,Google的新模型相比之前的版本没有太大变化。Google表示第二代模型将拥有原始模型的速度优势,同时受益于专业版(以及Gemini 3)的世界知识库,从而产生更真实的输出结果。作为CNET的创意AI专家,我必须对这个新模型进行全面测试。毕竟,Nano Banana Pro是我们在众多AI图像工具中的最佳整体选择,尽管它确实让我思考AI工具是否已经变得过于强大。
经过测试后,我发现Google的说法基本正确。Nano Banana 2是一个快速的伙伴,让我再次想起为什么Google仍然是AI领域的巨头之一。但我确实发现了它性能上的一些缺陷,证明仍有改进空间。
以下是Nano Banana 2与原始版本和专业版模型的对比表现。关于测试过程的说明:我将测试限制在照片编辑方面,因为这是Nano Banana的主要应用场景之一。当然,你也可以用它创建完全由AI生成的图像。
Nano Banana 2照片编辑能力
我一直在与Gemini进行一场单方面的较量,因为它无法修复我去年拍摄的《怪诞星期五》电影海报照片。夕阳西下的光线恰好以某个角度照射在玻璃上,遮挡了海报的很大一部分。Nano Banana 1在这个任务上完全失败了。升级后的专业版模型表现也好不到哪里去。所以,我必须看看Nano Banana 2是否能胜任这个挑战。剧透:它不能。
看,显然这只是我拍的一张糟糕照片,完全是人为错误。在编辑中去除反射是出了名的困难。但创意AI的主要卖点之一就是它能够修复你的糟糕照片,用技术来纠正人为错误。显然,在最糟糕的情况下它做不到这一点,这令人失望。
不过在不那么糟糕的情况下,Nano Banana 2在去除CNET高级社交媒体经理Allyza Umali眼镜上较小、破坏性较小的反射方面做得还不错。
在图像编辑方面,Nano Banana 2的表现与专业版模型相似。第二代模型最明显的优势是速度——专业版模型需要2-5分钟来创建图像,而使用基础模型快速模式创建图像的结果在不到一分钟内就能完成。
你为了速度所牺牲的是精确度。我要求Nano Banana 2拍摄一张全家福,并把我们放在北卡罗来纳州阿巴拉契亚州立大学的足球场上。它做得还不错,但专业版模型细化了细节,并在未被要求的情况下包含了额外的清晰文本,如体育场名称。
对于更大的编辑,比如改变图像风格,Nano Banana 2和专业版模型的表现相似。当我要求它模仿点彩画派风格时,我没有注意到大的差异,尽管放大后,你可以在专业版的输出中看到更多精细的点。
Nano Banana以其逼真效果而闻名,因此对于那些寻求一些AI驱动的编辑助力的人来说,它是首选。它确实是现有选项中最好的。但有时你只需要接受有些错误是无法修复的,也许我们的照片保持原样会更好。
我应该使用Nano Banana 2吗
Nano Banana模型之所以位居榜首是有充分理由的。它们擅长各种风格,并在其他工具失败的地方表现出色,比如逼真效果和包含文本。它绝不完美,但如果你在寻找选择,它确实值得探索。
Google在发布Nano Banana 2时从其选项中撤掉了原始的Nano Banana模型,所以你只需要在Nano Banana 2和专业版模型之间选择。如果你需要快速构思并且不在乎精细细节,坚持使用Nano Banana 2。专业版模型在更精确的工作方面有更多功能,但要准备好为你的生成等待更长时间。
以Nano Banana为首的AI图像工具激增,加剧了艺术家对AI在创意工作中所扮演角色的担忧。虽然一些创作者正在拥抱AI,但其他人更加犹豫,指出了该技术的法律、伦理和环境问题。
Q&A
Q1:Nano Banana 2相比之前的版本有什么改进?
A:Nano Banana 2保持了原始模型的速度优势,同时融入了专业版和Gemini 3的世界知识库,能够产生更真实的输出结果。在快速模式下,它能在不到一分钟内完成图像创建,而专业版需要2-5分钟。
Q2:Nano Banana 2在照片编辑方面表现如何?
A:Nano Banana 2在处理小型反射等简单编辑任务时表现不错,但在处理复杂的反射去除或严重图像缺陷时仍有局限性。它擅长风格转换和基础的图像修复,但精确度不如专业版模型。
Q3:应该选择Nano Banana 2还是专业版模型?
A:如果需要快速构思且不在乎精细细节,建议选择Nano Banana 2。如果需要更精确的工作和更好的细节处理,专业版模型更合适,但需要等待更长的生成时间。两者都擅长逼真效果和文本处理。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。