Google 已开始向 Gemini Live 推出新的 AI 功能,让它能够"看到"你的屏幕或通过智能手机摄像头进行实时问答,Google 发言人 Alex Joseph 在发给 The Verge 的邮件中确认了这一消息。这些功能的推出距离 Google 首次展示支持这些功能的"Project Astra"项目已近一年。
据 9to5Google 报道,一位 Reddit 用户表示该功能出现在他们的小米手机上。今天,这位用户发布了一段视频,展示了 Gemini 新的屏幕阅读能力。这是 Google 在三月初宣布的两项功能之一,当时表示这些功能"将作为 Google One AI Premium 计划的一部分,在本月晚些时候向 Gemini Advanced 订阅用户开放"。
目前正在推出的另一项 Astra 功能是实时视频,它允许 Gemini 实时解读智能手机摄像头的画面并回答相关问题。在 Google 本月发布的演示视频中,一个人使用该功能请求 Gemini 帮助决定为新上釉的陶器选择什么颜色的涂料。
Google 推出这些功能的时机恰逢其在 AI 助手领域保持领先优势之际,此时 Amazon 正准备有限度地推出 Alexa Plus 升级版的早期访问,而 Apple 则推迟了其升级版 Siri 的发布。这两款产品都应该具有类似于 Astra 现在开始启用的功能。与此同时,虽然 Samsung 仍然拥有 Bixby,但 Gemini 依然是其手机上的默认助手。
好文章,需要你的鼓励
本文介绍了如何在Windows和macOS等主流操作系统上使用免费开源软件,无需更换操作系统即可摆脱付费订阅。文章推荐了Ninite等工具来安装免费软件,并详细介绍了Firefox、Thunderbird、LibreOffice、VLC等优秀的开源替代方案。作者强调虽然学习新工具需要时间投入,但从长远来看,使用不依赖订阅模式的替代工具将带来巨大回报。
这项研究由北京交通大学研究团队完成,系统阐述了人工智能智能体从"流水线"范式向"模型原生"范式的转变。研究表明,通过强化学习,AI可以自主学会规划、使用工具和管理记忆等核心能力,而不再依赖外部脚本。论文详细分析了这一范式转变如何重塑深度研究助手和GUI智能体等实际应用,并探讨了未来多智能体协作和自我反思等新兴能力的发展方向。
随着生成式人工智能系统提供直接答案而非链接列表,传统搜索引擎优化正面临重大变革。谷歌AI概述功能已覆盖约30%的美国搜索,导致网站点击率大幅下降。专家预测,到2030年AI将占B2B软件研究的70%以上。AI引擎更重视结构化数据、实体识别和权威性,而非传统的关键词和反向链接。营销人员需要采用实体权威工程等新策略来优化AI可见性。
Prime Intellect团队发布开源AI训练全栈INTELLECT-3,这个106亿参数模型在数学、编程等测试中超越多个大型前沿模型。团队完全开源了包括prime-rl训练框架、环境库、代码执行系统在内的完整基础设施,为AI研究社区提供了高质量的训练工具,推动AI技术民主化发展。