Google Home升级Gemini语音理解能力
现在你可以通过描述想要的效果让Gemini调节照明
Google正在推出Home应用的新一轮更新,根据本周发布的更新说明,此次更新旨在让用户使用Gemini AI助手控制智能家居时变得"更加自然和可靠"。通过此次更新,用户可以描述想要的照明类型,比如说"海洋的颜色",Gemini就会根据你的提示选择相应的颜色。
在要求Gemini控制家电或气候设备时,用户也可以使用更自然和精确的语言。这意味着你现在可以告诉Gemini"将智能烤箱预热到350度"或设置特定的湿度水平。据Google介绍,Google还改进了Gemini识别设备的能力,比如"区分'台灯'和'灯光'",让它能更快地完成请求。拥有受监督Google账户的儿童现在也能访问Gemini for Home功能。
这次最新更新紧随本月早些时候为摄像头引入的"实时搜索"功能,以及对Gemini理解上下文能力的改进。
此外,Google宣布将为Gemini Live带来更新,该功能允许用户与智能助手进行对话交流。Gemini Live的新闻摘要功能在智能显示器和音箱上现在变得"更加深入和交互性更强"。在对话过程中,你可以询问Gemini"最新新闻是什么?"或"给我介绍一下科技新闻"等问题来获取详细摘要。所有这些更新现在都在逐步推出。
Q&A
Q1:Gemini在智能家居控制方面有什么新功能?
A:Gemini现在可以通过自然语言描述来控制智能家居设备。比如你可以说"海洋的颜色"来调节照明,或者说"将智能烤箱预热到350度"来控制家电,还能设置特定的湿度水平等。
Q2:Gemini Live的新闻摘要功能怎么使用?
A:Gemini Live在智能显示器和音箱上提供更深入、更具交互性的新闻摘要。你可以在对话中询问"最新新闻是什么?"或"给我介绍一下科技新闻"等问题,Gemini会为你提供详细的新闻摘要。
Q3:哪些用户可以使用Gemini for Home功能?
A:除了普通用户外,拥有受监督Google账户的儿童现在也能访问Gemini for Home功能。这让更多家庭成员都能通过语音助手来控制智能家居设备。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。