谷歌表示,Gemini 现在可以使用搜索历史来为其响应提供参考,并补充说该聊天机器人在未来几个月内将获得对 YouTube 和 Photos 等其他平台的访问权限。用户需要授权 Gemini 引用搜索历史记录,并可以随时断开连接。
谷歌表示:"只有当我们的高级推理模型确定搜索历史确实有帮助时,我们才会使用它。"同时补充说他们将继续收集早期测试者的反馈。
个性化功能可以通过 Gemini 的模型下拉菜单找到。谷歌表示,在用户输入提示后,"它将分析提示并确定您的搜索历史是否可以增强响应效果"。
从周四开始,Gemini 和 Gemini Advanced 订阅用户可以通过网页访问这项实验性的个性化功能,该功能也正在移动端推出。支持个性化的 Gemini 将在谷歌运营的大多数国家以超过 40 种语言提供服务。
该聊天机器人由谷歌上个月在其 Gemini 应用程序中推出的 Gemini 2.0 Flash Thinking Experimental 模型驱动。该模型经过训练,通过逐步分解提示并向用户展示其"思考过程"来"加强其推理能力",让用户了解它是如何得出响应的。去年 12 月,谷歌推出了 Gemini 2.0,谷歌首席执行官桑达尔·皮查伊表示,这"将使我们能够构建新的 AI 代理,让我们更接近通用助手的愿景"。
谷歌还在周四表示,它将为 2.0 Flash Thinking Experimental 模型提供更长的上下文窗口以处理更大量的信息,并增加上传文件等新功能。该公司还表示正在用该模型升级其 Deep Research 功能。这项功能将向普通 Gemini 用户免费开放,可以在浏览数百个网页后在几分钟内编制多页研究报告。
Gemini 应用程序还将获得谷歌的 Gems 功能,现在所有用户都可以免费构建自己的个人 AI 专家,涵盖语言和数学等主题。
好文章,需要你的鼓励
芬兰阿尔托大学研究团队开发出革命性光学计算方法,利用单束光线实现复杂张量运算。该技术将数字信息编码到光波的振幅和相位中,通过光波相互作用自动完成深度学习所需的矩阵和张量乘法运算。与传统GPU逐步处理不同,光学系统可同时并行执行所有计算操作,运算速度达到光速级别。研究显示该方法具有被动处理、低功耗等优势,预计3-5年内可集成到现有硬件平台,为AI计算带来重大突破。
新加坡科技设计大学研究团队发现,通过控制大型语言模型的"思考语言"可显著提升输出多样性。研究显示,AI用非英语语言思考时能产生更多样化的答案,且距离英语越远的语言效果越好。混合多种语言思考的策略表现最佳,不仅提升创意输出,还增强了文化多元化表达能力,为解决AI输出同质化问题提供了简单有效的方案。
科学家成功将传统公里级粒子加速器缩小至房间大小,并实现商业化。TAU Systems公司开发的激光驱动尾场加速器利用超强激光脉冲产生等离子体,将电子加速至相对论速度。该设备首先用于航天电子设备的辐射测试,能量范围60-100兆电子伏特,成本约1000万美元起。未来还可应用于医疗成像、芯片检测和X射线光刻等领域,有望大幅降低粒子加速器的使用门槛。
浙江大学研究团队开发了PhyRPR三阶段视频生成系统,解决AI视频中物理规律违背问题。该方法将物理理解与视觉生成分离处理:首先用大型语言模型进行物理推理和关键帧生成,然后规划连续运动轨迹,最后通过运动感知技术精化视觉效果。实验证明该方法在物理一致性和视觉质量方面均优于现有技术。