谷歌近日宣布,Gemini现在能够调用用户的谷歌账户数据,为图像生成功能提供个性化支持。此前,谷歌已允许用户通过Gmail、搜索记录和YouTube数据来个性化AI助手的文字回复,如今这一"个人智能"能力正式延伸至图像生成模型Imagen 2。
这项功能的核心目标是让用户账户中关联的数据——包括YouTube观看历史、邮件内容、谷歌相册等——自动为Imagen 2提供背景参考,从而减少用户手动描述的负担。例如,用户无需在提示词中详细说明个人偏好或上传参考图片,只需输入"画出我的荒岛必备物品",模型便能根据用户的个人数据生成包含其关心物品的图像。此外,如果用户已在谷歌相册中为联系人或宠物添加了标签,还可以直接告诉Gemini"画一幅妈妈的手绘插图",系统会自动从相册中找到匹配的参考照片,生成对应人物的图像。
如果生成的图像效果不理想,用户可以通过追加提示词进行调整,也可以点击"+"按钮从谷歌相册中手动选择新的参考图片。谷歌还提供了"来源"按钮,方便用户查看AI在生成图像时参考了哪些素材,或直接向Gemini询问特定图像的参考来源。
个性化用户数据是谷歌相较于其他AI助手竞争者的独特优势之一。将"个人智能"能力扩展至图像生成这一热门功能,是谷歌进一步强化自身竞争优势的自然延伸。目前,这一个性化图像生成功能已面向Gemini应用中符合条件的AI Pro和AI Ultra订阅用户开放。谷歌表示,该功能将在近期推广至Chrome版Gemini及更多用户。
Q&A
Q1:Gemini的"个人智能"图像生成功能是什么?它能做什么?
A:Gemini的"个人智能"图像生成功能是谷歌推出的一项新能力,允许Imagen 2在生成图像时自动调用用户的谷歌账户数据,包括YouTube历史、邮件和谷歌相册等。用户无需手动提供个人信息或参考图片,只需输入简短的自然语言指令,系统便能生成符合个人偏好的个性化图像。
Q2:Gemini图像生成用到了哪些谷歌个人数据?
A:Gemini图像生成功能可以调用的谷歌个人数据包括:YouTube观看历史、Gmail邮件内容以及谷歌相册(包括用户为联系人或宠物设置的标签)。这些数据作为背景参考信息,帮助Imagen 2理解用户的个人偏好,从而生成更贴合用户需求的图像,无需用户在提示词中额外说明。
Q3:Gemini个性化图像生成功能目前面向哪些用户开放?
A:目前,该功能仅面向Gemini应用中符合条件的AI Pro和AI Ultra订阅用户开放。谷歌表示,后续将把该功能推广至Chrome版Gemini以及更多普通用户,但具体上线时间尚未明确,官方表示会"尽快"推出。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。