Google 已开始向 Gemini Live 推出新的 AI 功能,让它能够"看到"你的屏幕或通过智能手机摄像头进行实时问答,Google 发言人 Alex Joseph 在发给 The Verge 的邮件中确认了这一消息。这些功能的推出距离 Google 首次展示支持这些功能的"Project Astra"项目已近一年。
据 9to5Google 报道,一位 Reddit 用户表示该功能出现在他们的小米手机上。今天,这位用户发布了一段视频,展示了 Gemini 新的屏幕阅读能力。这是 Google 在三月初宣布的两项功能之一,当时表示这些功能"将作为 Google One AI Premium 计划的一部分,在本月晚些时候向 Gemini Advanced 订阅用户开放"。
目前正在推出的另一项 Astra 功能是实时视频,它允许 Gemini 实时解读智能手机摄像头的画面并回答相关问题。在 Google 本月发布的演示视频中,一个人使用该功能请求 Gemini 帮助决定为新上釉的陶器选择什么颜色的涂料。
Google 推出这些功能的时机恰逢其在 AI 助手领域保持领先优势之际,此时 Amazon 正准备有限度地推出 Alexa Plus 升级版的早期访问,而 Apple 则推迟了其升级版 Siri 的发布。这两款产品都应该具有类似于 Astra 现在开始启用的功能。与此同时,虽然 Samsung 仍然拥有 Bixby,但 Gemini 依然是其手机上的默认助手。
好文章,需要你的鼓励
9月10日,在北京开放数据中心大会上,嘉实多热管理事业部大中华区业务总监仇圆圆直言:“液冷是一个必选项,而不是可选项。”
百川智能发布突破性AI模型Baichuan-Omni-1.5,实现文字、图像、视频、音频的统一理解与生成。该7B参数模型在多项测试中超越同类产品,特别在医疗图像理解方面达到83.8%准确率,超过72B参数竞争模型。研究团队使用500亿高质量多模态数据,创新的四阶段训练策略,以及独创的音频处理技术,解决了多模态AI的关键技术难题,为人机交互开辟新方向。
Mozilla和EleutherAI联合发布了一份关于创建开放授权大语言模型训练数据集的最佳实践指南。该研究通过召集30位专家,制定了七个核心原则和详细的技术建议,旨在解决当前AI训练数据版权争议、透明度不足等问题,推动构建更加开放、公平和可持续的AI生态系统,为未来AI发展提供了重要的指导框架。