谷歌表示,Gemini 现在可以使用搜索历史来为其响应提供参考,并补充说该聊天机器人在未来几个月内将获得对 YouTube 和 Photos 等其他平台的访问权限。用户需要授权 Gemini 引用搜索历史记录,并可以随时断开连接。
谷歌表示:"只有当我们的高级推理模型确定搜索历史确实有帮助时,我们才会使用它。"同时补充说他们将继续收集早期测试者的反馈。
个性化功能可以通过 Gemini 的模型下拉菜单找到。谷歌表示,在用户输入提示后,"它将分析提示并确定您的搜索历史是否可以增强响应效果"。
从周四开始,Gemini 和 Gemini Advanced 订阅用户可以通过网页访问这项实验性的个性化功能,该功能也正在移动端推出。支持个性化的 Gemini 将在谷歌运营的大多数国家以超过 40 种语言提供服务。
该聊天机器人由谷歌上个月在其 Gemini 应用程序中推出的 Gemini 2.0 Flash Thinking Experimental 模型驱动。该模型经过训练,通过逐步分解提示并向用户展示其"思考过程"来"加强其推理能力",让用户了解它是如何得出响应的。去年 12 月,谷歌推出了 Gemini 2.0,谷歌首席执行官桑达尔·皮查伊表示,这"将使我们能够构建新的 AI 代理,让我们更接近通用助手的愿景"。
谷歌还在周四表示,它将为 2.0 Flash Thinking Experimental 模型提供更长的上下文窗口以处理更大量的信息,并增加上传文件等新功能。该公司还表示正在用该模型升级其 Deep Research 功能。这项功能将向普通 Gemini 用户免费开放,可以在浏览数百个网页后在几分钟内编制多页研究报告。
Gemini 应用程序还将获得谷歌的 Gems 功能,现在所有用户都可以免费构建自己的个人 AI 专家,涵盖语言和数学等主题。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。