Google 宣布为 Workspace 应用程序增加新的 Gemini 功能。即使你并不期待由两个 AI 生成的播客主持人在你把文档发送给老板之前为你讲解文档的要点,但这项功能还是来了。这次更新包含了多项新功能,从可以在文档中提供建议的编辑器到帮助理解电子表格的工具,所有这些功能都以 Gemini 为核心。
其中最令人印象深刻的可能是播客功能,这项功能已经在一些地方出现过。它在 Google 的 NotebookLM 研究工具中引起了广泛关注,在上传文件到 Gemini 应用时也可以使用。这次更新将在"未来几周内"向 Workspace 账户开放,它将在 Google Docs 中直接提供音频概述,同时还可以让 AI 为你朗读文章。让 AI 朗读你的写作内容确实很有用,不过我用 Gemini 基于我写的一篇文章生成了一个"播客",但我并不急于再次使用这个功能。
Google Docs 即将推出的另一项功能是"帮助我完善"提示。它不是直接帮你写作,而是通过评论的方式为如何改进现有草稿提供建议。作为一名编辑,我很熟悉这个概念,这些建议确实很有用。如果你无法获得一位真人编辑的帮助,AI 版本可能是个不错的选择。这项功能将在"本季度晚些时候"推出。
展望未来,Google 对 Sheets 做出了一些宏大但模糊的承诺。目前,你可以向 Gemini 寻求特定问题和任务的帮助,比如生成可视化内容。一个名为"帮助我分析"的功能提供了更广泛的范围,帮助你理解电子表格。理论上,它将帮助你识别趋势并提供"入门指导",有点像一个随需应变的数据分析师。看起来我们还需要等待一段时间才能尝试这个功能——它将在"今年晚些时候"推出。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。