距离Google发布上一代AI图像模型已经过去三个月,考虑到AI发展的飞速步伐,我们早就该迎来新的更新了。Google没有让我们失望,在二月底推出了Nano Banana 2。
乍看之下,Google的新模型相比之前的版本没有太大变化。Google表示第二代模型将拥有原始模型的速度优势,同时受益于专业版(以及Gemini 3)的世界知识库,从而产生更真实的输出结果。作为CNET的创意AI专家,我必须对这个新模型进行全面测试。毕竟,Nano Banana Pro是我们在众多AI图像工具中的最佳整体选择,尽管它确实让我思考AI工具是否已经变得过于强大。
经过测试后,我发现Google的说法基本正确。Nano Banana 2是一个快速的伙伴,让我再次想起为什么Google仍然是AI领域的巨头之一。但我确实发现了它性能上的一些缺陷,证明仍有改进空间。
以下是Nano Banana 2与原始版本和专业版模型的对比表现。关于测试过程的说明:我将测试限制在照片编辑方面,因为这是Nano Banana的主要应用场景之一。当然,你也可以用它创建完全由AI生成的图像。
Nano Banana 2照片编辑能力
我一直在与Gemini进行一场单方面的较量,因为它无法修复我去年拍摄的《怪诞星期五》电影海报照片。夕阳西下的光线恰好以某个角度照射在玻璃上,遮挡了海报的很大一部分。Nano Banana 1在这个任务上完全失败了。升级后的专业版模型表现也好不到哪里去。所以,我必须看看Nano Banana 2是否能胜任这个挑战。剧透:它不能。
看,显然这只是我拍的一张糟糕照片,完全是人为错误。在编辑中去除反射是出了名的困难。但创意AI的主要卖点之一就是它能够修复你的糟糕照片,用技术来纠正人为错误。显然,在最糟糕的情况下它做不到这一点,这令人失望。
不过在不那么糟糕的情况下,Nano Banana 2在去除CNET高级社交媒体经理Allyza Umali眼镜上较小、破坏性较小的反射方面做得还不错。
在图像编辑方面,Nano Banana 2的表现与专业版模型相似。第二代模型最明显的优势是速度——专业版模型需要2-5分钟来创建图像,而使用基础模型快速模式创建图像的结果在不到一分钟内就能完成。
你为了速度所牺牲的是精确度。我要求Nano Banana 2拍摄一张全家福,并把我们放在北卡罗来纳州阿巴拉契亚州立大学的足球场上。它做得还不错,但专业版模型细化了细节,并在未被要求的情况下包含了额外的清晰文本,如体育场名称。
对于更大的编辑,比如改变图像风格,Nano Banana 2和专业版模型的表现相似。当我要求它模仿点彩画派风格时,我没有注意到大的差异,尽管放大后,你可以在专业版的输出中看到更多精细的点。
Nano Banana以其逼真效果而闻名,因此对于那些寻求一些AI驱动的编辑助力的人来说,它是首选。它确实是现有选项中最好的。但有时你只需要接受有些错误是无法修复的,也许我们的照片保持原样会更好。
我应该使用Nano Banana 2吗
Nano Banana模型之所以位居榜首是有充分理由的。它们擅长各种风格,并在其他工具失败的地方表现出色,比如逼真效果和包含文本。它绝不完美,但如果你在寻找选择,它确实值得探索。
Google在发布Nano Banana 2时从其选项中撤掉了原始的Nano Banana模型,所以你只需要在Nano Banana 2和专业版模型之间选择。如果你需要快速构思并且不在乎精细细节,坚持使用Nano Banana 2。专业版模型在更精确的工作方面有更多功能,但要准备好为你的生成等待更长时间。
以Nano Banana为首的AI图像工具激增,加剧了艺术家对AI在创意工作中所扮演角色的担忧。虽然一些创作者正在拥抱AI,但其他人更加犹豫,指出了该技术的法律、伦理和环境问题。
Q&A
Q1:Nano Banana 2相比之前的版本有什么改进?
A:Nano Banana 2保持了原始模型的速度优势,同时融入了专业版和Gemini 3的世界知识库,能够产生更真实的输出结果。在快速模式下,它能在不到一分钟内完成图像创建,而专业版需要2-5分钟。
Q2:Nano Banana 2在照片编辑方面表现如何?
A:Nano Banana 2在处理小型反射等简单编辑任务时表现不错,但在处理复杂的反射去除或严重图像缺陷时仍有局限性。它擅长风格转换和基础的图像修复,但精确度不如专业版模型。
Q3:应该选择Nano Banana 2还是专业版模型?
A:如果需要快速构思且不在乎精细细节,建议选择Nano Banana 2。如果需要更精确的工作和更好的细节处理,专业版模型更合适,但需要等待更长的生成时间。两者都擅长逼真效果和文本处理。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。