谷歌于周二宣布,将为旗下Chrome浏览器新增更多AI功能。此次推出的全新功能名为"技能"(Skills),允许用户保存并重复使用常用的AI提示词,这些提示词可在不同网页上直接运行,无需重复输入。
该功能与谷歌将Gemini AI集成至Chrome的举措紧密相关。与此同时,浏览器生态系统也迎来了一批新竞争对手,包括OpenAI(Atlas)、Perplexity(Comet)以及The Browser Company(Dia)等公司推出的新型浏览器产品。
Gemini目前已支持用户对网页内容进行提问、信息摘要以及执行多种任务。"技能"功能在此基础上更进一步,允许用户创建可随时调用的AI提示词,只需点击一下即可使用。
举例来说,谷歌表示,如果用户在浏览食谱网站时经常要求Gemini推荐纯素食替代方案,现在只需将该提示词保存为一项"技能",便可在不同网页上反复使用。
在使用方式上,用户可直接从聊天记录中将AI提示词保存为"技能"。保存后,在Chrome中使用Gemini时,只需输入正斜杠(/)或点击加号(+)按钮即可调用。该"技能"将在当前浏览的网页以及已选定的其他标签页上运行。此外,谷歌还表示,这些"技能"支持随时编辑修改。
在内部测试中,谷歌发现早期用户主要将"技能"应用于健康与养生领域——例如计算食谱中的蛋白质含量——以及购物比价、扫描和摘要长篇文档等场景。
为帮助用户快速上手,谷歌还同步推出了"技能库",提供涵盖效率提升、购物、食谱、预算管理等多个领域的常用任务和工作流模板。用户只需将预置"技能"添加至Chrome的已保存技能列表即可使用,也可通过编辑提示词对其进行个性化定制。
与Chrome中其他Gemini操作一样,"技能"在执行发送电子邮件或添加日历事件等特定操作前,会先向用户请求确认。
"技能"功能将于即日起向已登录谷歌账号的Chrome桌面端用户逐步开放。该功能初期仅支持将Chrome浏览器语言设置为英语(美国)的用户使用。
Q&A
Q1:Chrome的AI"技能"功能是什么?能做什么?
A:Chrome的AI"技能"(Skills)功能是谷歌为Chrome浏览器新增的一项AI功能,允许用户将常用的Gemini AI提示词保存下来,并在不同网页上一键调用,无需重复输入。例如,用户可以保存"推荐纯素食替代方案"的提示词,在浏览任何食谱网站时直接使用,也可用于购物比价、文档摘要等场景。
Q2:Chrome的"技能库"有什么用?
A:谷歌推出的"技能库"提供了一批预置的常用任务模板,覆盖效率提升、购物、食谱、预算管理等多个领域。用户可以直接将技能库中的模板添加到自己的已保存技能列表中使用,也可以根据个人需求对提示词进行编辑和自定义,帮助用户快速上手,减少从零创建提示词的门槛。
Q3:Chrome的AI"技能"功能目前向哪些用户开放?
A:该功能目前面向已登录谷歌账号的Chrome桌面端用户逐步开放,但初期仅支持将Chrome浏览器语言设置为英语(美国)的用户使用,暂不支持其他语言版本。
好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。