谷歌近日宣布,Gemini现在能够调用用户的谷歌账户数据,为图像生成功能提供个性化支持。此前,谷歌已允许用户通过Gmail、搜索记录和YouTube数据来个性化AI助手的文字回复,如今这一"个人智能"能力正式延伸至图像生成模型Imagen 2。
这项功能的核心目标是让用户账户中关联的数据——包括YouTube观看历史、邮件内容、谷歌相册等——自动为Imagen 2提供背景参考,从而减少用户手动描述的负担。例如,用户无需在提示词中详细说明个人偏好或上传参考图片,只需输入"画出我的荒岛必备物品",模型便能根据用户的个人数据生成包含其关心物品的图像。此外,如果用户已在谷歌相册中为联系人或宠物添加了标签,还可以直接告诉Gemini"画一幅妈妈的手绘插图",系统会自动从相册中找到匹配的参考照片,生成对应人物的图像。
如果生成的图像效果不理想,用户可以通过追加提示词进行调整,也可以点击"+"按钮从谷歌相册中手动选择新的参考图片。谷歌还提供了"来源"按钮,方便用户查看AI在生成图像时参考了哪些素材,或直接向Gemini询问特定图像的参考来源。
个性化用户数据是谷歌相较于其他AI助手竞争者的独特优势之一。将"个人智能"能力扩展至图像生成这一热门功能,是谷歌进一步强化自身竞争优势的自然延伸。目前,这一个性化图像生成功能已面向Gemini应用中符合条件的AI Pro和AI Ultra订阅用户开放。谷歌表示,该功能将在近期推广至Chrome版Gemini及更多用户。
Q&A
Q1:Gemini的"个人智能"图像生成功能是什么?它能做什么?
A:Gemini的"个人智能"图像生成功能是谷歌推出的一项新能力,允许Imagen 2在生成图像时自动调用用户的谷歌账户数据,包括YouTube历史、邮件和谷歌相册等。用户无需手动提供个人信息或参考图片,只需输入简短的自然语言指令,系统便能生成符合个人偏好的个性化图像。
Q2:Gemini图像生成用到了哪些谷歌个人数据?
A:Gemini图像生成功能可以调用的谷歌个人数据包括:YouTube观看历史、Gmail邮件内容以及谷歌相册(包括用户为联系人或宠物设置的标签)。这些数据作为背景参考信息,帮助Imagen 2理解用户的个人偏好,从而生成更贴合用户需求的图像,无需用户在提示词中额外说明。
Q3:Gemini个性化图像生成功能目前面向哪些用户开放?
A:目前,该功能仅面向Gemini应用中符合条件的AI Pro和AI Ultra订阅用户开放。谷歌表示,后续将把该功能推广至Chrome版Gemini以及更多普通用户,但具体上线时间尚未明确,官方表示会"尽快"推出。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。