谷歌发布文生图模型Imagen 3,写实效果超强!
Imagen3在理解文本提示方面比前两代更好,可捕捉长文本提示中的很多细微细节,对图片的嵌入文字生成也更加准确、稳定。
?
?谷歌在“I/O2024”大会上发布了,全新文生图片模型Imagen3。
据悉,Imagen3在理解文本提示方面比前两代更好,可捕捉长文本提示中的很多细微细节,对图片的嵌入文字生成也更加准确、稳定。
Imagen3可生成漫画、写实、赛博朋克、水墨、油画、素描等几十种风格,尤其是生成的写实风格图片质量很好,和真人拍摄的相片几乎差不多。
目前,Imagen3支持申请试用,有兴趣的小伙伴可以去体验下。
可申请体验:https://docs.google.com/forms/d/e/1FAIpQLSeC6n1KQlaqRNUGNuNRt5Q7YeoyXsq828niw2ZvIoAtW1FtYQ/viewform?resourcekey=0-qDKZCeB4G9nS9dttXGdnHQ&pli=1
在谷歌展示的Imagen3案例中,其生成写实图片的能力非常强可比肩Midjourney DALL·E 3 等头部产品。
例如,用单反相机和偏振滤镜拍摄。这是在土耳其卡帕多西亚独特的岩石形态上空漂浮的两个热气球的照片。这些热气球上的颜色和图案与下方土地的土色形成了美丽的对比。
一张特写照片,展示一只折纸鸟在城市天际线中翱翔,与其他不同颜色和图案的鸟群一起,投射出复杂的阴影在下方的建筑物上。
三名女性站在一起爽朗大笑,前景中有一名女性略微模糊。太阳在她们身后落山,形成了镜头光晕和温暖的光芒,突显了她们的头发,并在背景中产生了浅景深效果。
摄影风格真实自然,捕捉到了朋友之间真挚的连接和快乐时刻。黄金时刻的温暖光线赋予了图像怀旧和亲密的感觉。
一头优雅的狼站在灰色背景前,特写镜头展现其雄姿,高分辨率照片展现了丰富的细节,色彩梯度采用超现实风格。
从上面看到美丽的河谷,有树木展示了其令人惊叹的自然美景,绿色的山脉和蓝色的水。捕捉了大自然创造的广阔风貌,写实风格。
一双磨损严重、沾满泥巴的徒步皮靴,静静地躺在崎岖的小径上。一只松鼠的头从其中一只靴子里探出来,懒洋洋地看着镜头,仿佛这是它的领地。
两只靴子的鞋带松松地垂落在地上。背景是多山的景色。这是一张电影般的静止画面,用高质量的数码单反相机拍摄。
除了写实风格照片,谷歌还展示了其他类型风格的图片,例如,一个风化的木制机械机器人被开满鲜花的藤蔓覆盖,安静地站在一片高大的野花田中,一只小蓝鸟停在它伸出的手上。数字卡通、色彩温暖、线条柔和。后面是一座高大的瀑布悬崖。
桌子上放着一个旧蓝色玻璃花瓶里的一大束色彩斑斓的花。前面是一朵美丽的牡丹花,周围有玫瑰、百合、雏菊、兰花、水果、浆果和绿叶等各种其他花朵。背景是深灰色。这是荷兰黄金时代风格的油画。
从上面这些案例不难看出,Imagen3在文本语义还原、光影、饱和度、景深、构图等方面比前两代更出色,几乎和真人拍摄的图片差不多,这对于游戏开发、市场营销、日常办公等人员,提供快速设计图片的捷径。
谷歌表示,为了满足不同领域用户的创作需求,Imagen3将推出多个版本,包括从快速草图到高分辨率图像等各类任务优化。目前,Imagen3支持申请使用,并很快将在VertexAI上全面推广使用。
0赞好文章,需要你的鼓励
推荐文章
“Mercor正在训练的模型,比人类更懂如何预测工作表现。”
Xbox 部门推出了名为 Muse 的生成式 AI 模型,旨在为游戏创造视觉效果和玩法。这一举措反映了微软全面拥抱 AI 技术的战略,尽管游戏开发者对 AI 持谨慎态度。Muse 不仅可能提高游戏开发效率,还有望实现老游戏的现代化改造,但其实际效果和对行业的影响仍有待观察。
Sonar收购AutoCodeRover,旨在通过自主AI代理增强其代码质量工具。这项收购将使Sonar客户能够自动化调试和问题修复等任务,让开发者将更多时间用于改进应用程序而非修复bug。AutoCodeRover的AI代理能够自主修复有问题的代码,将与Sonar的工具集成,提高开发效率并降低成本。
人工智能正在推动数据中心的变革。为满足 AI workload 的需求,数据中心面临前所未有的电力消耗增长、散热压力和设备重量挑战。应对这些挑战需要创新的解决方案,包括 AI 专用硬件、可再生能源、液冷技术等。同时,数据中心还需平衡监管压力和社区关切。未来数据中心的发展将决定 AI 技术能否实现其变革性潜力。