Google 宣布为 Workspace 应用程序增加新的 Gemini 功能。即使你并不期待由两个 AI 生成的播客主持人在你把文档发送给老板之前为你讲解文档的要点,但这项功能还是来了。这次更新包含了多项新功能,从可以在文档中提供建议的编辑器到帮助理解电子表格的工具,所有这些功能都以 Gemini 为核心。
其中最令人印象深刻的可能是播客功能,这项功能已经在一些地方出现过。它在 Google 的 NotebookLM 研究工具中引起了广泛关注,在上传文件到 Gemini 应用时也可以使用。这次更新将在"未来几周内"向 Workspace 账户开放,它将在 Google Docs 中直接提供音频概述,同时还可以让 AI 为你朗读文章。让 AI 朗读你的写作内容确实很有用,不过我用 Gemini 基于我写的一篇文章生成了一个"播客",但我并不急于再次使用这个功能。
Google Docs 即将推出的另一项功能是"帮助我完善"提示。它不是直接帮你写作,而是通过评论的方式为如何改进现有草稿提供建议。作为一名编辑,我很熟悉这个概念,这些建议确实很有用。如果你无法获得一位真人编辑的帮助,AI 版本可能是个不错的选择。这项功能将在"本季度晚些时候"推出。
展望未来,Google 对 Sheets 做出了一些宏大但模糊的承诺。目前,你可以向 Gemini 寻求特定问题和任务的帮助,比如生成可视化内容。一个名为"帮助我分析"的功能提供了更广泛的范围,帮助你理解电子表格。理论上,它将帮助你识别趋势并提供"入门指导",有点像一个随需应变的数据分析师。看起来我们还需要等待一段时间才能尝试这个功能——它将在"今年晚些时候"推出。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。