Google LLC 正在更新 Google 搜索中的新"AI 模式"功能,引入多模态能力,使其能够"看到"用户上传的图片,从而更好地回答用户的问题。
AI 模式上个月在 Google One AI Premium 订阅用户中进行了有限预览。这是 Google 搜索中的一项实验性功能,它使用生成式人工智能,允许用户提出复杂的多部分问题和后续查询,以深入探索特定主题。
通过今天的更新,那些能够访问 AI 模式的用户现在可以上传图片并询问关于它所看到内容的问题,Google 在今天的博客文章中透露了这一信息。此外,AI 模式功能正在向数百万已加入其 Labs 计划以获取新应用程序早期访问权限的新用户推出。
Google 表示,AI 模式的图像分析功能由 Google Lens 中的多模态搜索能力提供支持。Google Lens 是一款智能手机应用程序,允许用户使用相机拍照并在 Google 搜索中搜索这些照片。
据 Google 介绍,AI 模式将能够理解任何上传图像中的整个场景,包括其中不同物体之间的关系。它还能够确定这些物体的材料、形状、颜色及其排列方式。它将就图像和其中的物体提出多个问题,从而能够提供比传统 Google 搜索更详细的回答。
举例来说,Google 表示,用户可以拍摄自己书架的照片,并输入查询"如果我喜欢这些书,有哪些类似的书可能适合我?" AI 模式将扫描图像以识别每本书,然后在研究这些书籍后推荐一系列其他书籍。
此外,用户可以提出后续问题。例如,用户可能强调"我在寻找一本快速阅读的书,这些推荐中哪一本最短?"
Google 搜索产品副总裁 Robby Stein 强调,"AI 模式建立在多年视觉搜索领域的工作基础上,并将其更进一步。"
鉴于 AI 模式仍是一项实验性功能,目前尚不清楚该服务的受欢迎程度如何。Google 上个月推出它是为了响应流行的生成式 AI 搜索应用程序,如 Perplexity 和 OpenAI 的 ChatGPT Search,这些应用程序提供类似的功能。
Google 表示,在更广泛发布之前,将继续完善用户体验并扩展 AI 模式的功能。
好文章,需要你的鼓励
香港大学联合多家顶尖机构开发出推测性雅可比降噪解码技术,巧妙融合扩散模型降噪与自回归并行处理,将AI图像生成速度提升2-5倍。该方法通过训练模型处理噪声输入并预测干净标记,实现多位置同时生成,在保持图像质量的同时大幅缩短等待时间,为AI创作应用带来革命性改善。
谷歌推出类似苹果私有云计算的新平台,让用户在享受先进AI功能的同时保护数据隐私。该平台将复杂AI请求转移到云端处理,确保敏感数据仅用户可见,连谷歌也无法访问。随着AI工具需要更强计算能力,这一方案平衡了隐私保护与性能需求。Pixel 10手机将获得更智能的Magic Cue建议和更多语言的录音转录功能。
韩国大学等机构研究团队提出TAG方法,解决AI绘画中的"幻觉"问题。该方法通过放大扩散过程中的切线分量来引导AI生成更真实图像,无需重训练模型且计算成本极低。实验显示TAG能显著改善图像质量,减少不合理细节如多指手等,同时可与现有引导技术结合使用,为AI绘画领域提供了简单有效的优化方案。