Google 已开始向 Gemini Live 推出新的 AI 功能,让它能够"看到"你的屏幕或通过智能手机摄像头进行实时问答,Google 发言人 Alex Joseph 在发给 The Verge 的邮件中确认了这一消息。这些功能的推出距离 Google 首次展示支持这些功能的"Project Astra"项目已近一年。
据 9to5Google 报道,一位 Reddit 用户表示该功能出现在他们的小米手机上。今天,这位用户发布了一段视频,展示了 Gemini 新的屏幕阅读能力。这是 Google 在三月初宣布的两项功能之一,当时表示这些功能"将作为 Google One AI Premium 计划的一部分,在本月晚些时候向 Gemini Advanced 订阅用户开放"。
目前正在推出的另一项 Astra 功能是实时视频,它允许 Gemini 实时解读智能手机摄像头的画面并回答相关问题。在 Google 本月发布的演示视频中,一个人使用该功能请求 Gemini 帮助决定为新上釉的陶器选择什么颜色的涂料。
Google 推出这些功能的时机恰逢其在 AI 助手领域保持领先优势之际,此时 Amazon 正准备有限度地推出 Alexa Plus 升级版的早期访问,而 Apple 则推迟了其升级版 Siri 的发布。这两款产品都应该具有类似于 Astra 现在开始启用的功能。与此同时,虽然 Samsung 仍然拥有 Bixby,但 Gemini 依然是其手机上的默认助手。
好文章,需要你的鼓励
铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。
上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。