去年11月,谷歌在发布Gemini 3时引入了"Gemini智能体"功能,将其定位为"能够处理多步骤任务的实验性功能"。而根据最新报道及本周发现的相关代码字符串,这一功能即将迎来重大升级。
APK Insight说明:在APK Insight系列文章中,我们会对谷歌上传至Play Store的最新版应用进行反编译分析。通过反编译这些APK文件,我们能够从代码中发现潜在的未来功能线索。需要注意的是,谷歌不一定会正式推出这些功能,我们的解读也可能存在偏差。对于完成度较高的功能,我们会尝试实际启用,并为大家呈现其界面效果。
《商业内幕》今日报道称,谷歌内部员工正在测试一款代号为"Remy"的产品,定位是"由Gemini驱动、服务于工作、学习和日常生活的全天候个人智能体"。
根据谷歌内部文件,该功能还有以下几种描述方式:
本周一,谷歌应用17.20版本进入Beta测试渠道,其中包含多条与"Gemini智能体"相关的新字符串。尽管该名称目前已是Google AI Ultra订阅用户可使用的现有功能,但这些新字符串所指向的,似乎是《商业内幕》报道中提及的重大升级版本。
升级后的Gemini智能体问候语为"今天有什么我可以帮您完成的?",同时被描述为"您的全天候数字伙伴"。
相关说明显示:"它可以在网页端以及您连接的应用和技能中代您执行操作,例如与他人沟通、共享文档、代为完成购物等。为此,它会调用您的聊天记录、已连接应用中的信息、个人上下文、个人智能数据、智能体文件以及位置信息。"
与此前版本一致,该功能仍属于实验性质,官方提示指出:"它可能出现错误或无意间暴露数据。请明确表达您的需求,在涉及敏感任务时需谨慎操作。请通过仪表板监督其任务执行情况。Gemini不适用于需要专业知识的任务,例如法律、医疗或金融类操作。"
在交互界面方面,用户仍以对话形式与智能体进行沟通,Gemini导航抽屉中可能会新增一个专属区域,用于集中展示任务状态,具体包括:
已完成的任务,支持置顶、重命名及后续继续操作;
进行中的任务,支持置顶、重命名及后续继续操作;
待用户输入的任务,支持置顶、重命名及后续继续操作;
已计划的任务,支持置顶、重命名及后续继续操作。
Q&A
Q1:Gemini智能体能帮用户做哪些事情?
A:Gemini智能体可以在网页端及用户连接的应用中代为执行多种操作,包括与他人沟通、共享文档、代为购物等多步骤任务。它会综合调用用户的聊天记录、已连接应用数据、个人上下文、位置信息等来完成任务。不过目前仍属实验性功能,不适用于法律、医疗、金融等需要专业知识的场景。
Q2:Gemini智能体代号"Remy"是什么?
A:根据《商业内幕》的报道,"Remy"是谷歌内部测试中对新版Gemini智能体的代号,定位为"由Gemini驱动、服务于工作、学习和日常生活的全天候个人智能体"。目前该功能仍处于内部测试阶段,尚未正式向公众开放。
Q3:Gemini智能体目前可以使用吗?
A:现阶段,Gemini智能体的基础版本已向Google AI Ultra订阅用户开放,但本次报道所涉及的重大升级版本尚处于内部测试及Beta阶段,暂未正式推出。用户可通过对话界面与智能体交互,并在专属任务面板中查看和管理各类任务进度。
好文章,需要你的鼓励
前OpenAI首席技术官Mira Murati创办的AI初创公司Thinking Machines Lab宣布推出"交互模型"技术。不同于现有AI的轮流对话方式,该模型采用"全双工"技术,能在接收输入的同时生成响应,实现类似真实电话通话的自然交互。其模型TML-Interaction-Small响应速度达0.40秒,优于OpenAI和谷歌同类产品。目前仍处于研究预览阶段,计划数月内开放有限测试,年内正式发布。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
澳大利亚各州及联邦能源部长在近期会议上达成共识,要求数据中心通过投资新建可再生能源和储能设施,完全抵消其电力需求。除昆士兰州外,所有州均支持该提议。联邦能源部长克里斯·鲍文表示,数据中心是新增能源需求的最大驱动力之一,应成为电网的助力而非负担。澳大利亚能源市场委员会将于7月前提交具体实施建议。数据显示,到2030年数据中心用电量预计将增至现在的三倍。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。