OpenAI 终于为 ChatGPT 用户添加了一项期待已久的功能:引用内部知识源的能力。
在此测试期间,ChatGPT Team 付费用户可以直接将内部知识数据库连接到平台,引入公司特定信息。许多企业表示,这一功能将能够提供更好的问题解答。
这使用户能够对数据进行语义搜索,在回答中直接链接到内部资源,获取最相关和最新的上下文信息,并确保 ChatGPT 能够理解公司内部术语。
目前,ChatGPT Team 管理员可以将 Google Drive 连接到 ChatGPT。不过,OpenAI 的产品经理 Nate Gonzales 在 LinkedIn 上发文表示,团队"正在开发下一波连接器,目标是支持团队当前依赖的所有关键内部知识源"。这可能包括数据分析平台和客户关系管理系统 (CRM)。
Gonzales 说:"我最喜欢的一点是:随着时间推移,模型会学习你组织的独特语言,包括项目名称、缩写词和团队特定术语,同时遵守用户权限,确保响应建立在正确的上下文中。(在 OpenAI,我们都喜欢使用代号)"。
内部文档提升机构知识
通过连接内部知识库,ChatGPT Team 可能对那些已经在使用平台进行战略咨询或分析的用户变得更加不可或缺。查询公司和领域特定数据为用户对话提供了更多上下文,使 AI 聊天机器人更加实用。
毫不意外,许多拥有 AI 平台、聊天机器人、代理或应用程序的公司都将其专有的内部知识图谱作为差异化优势。这也是企业搜索成为企业 AI 领域新兴方向的原因。
像 Glean 这样的公司提供了使用 AI 在企业内部查找信息的方法。ServiceNow 收购 MoveWorks 就是为了增强其企业搜索能力。
OpenAI 已经允许用户直接从 Google Drive 或 Microsoft OneDrive 上传文档。Google 将 Gemini 的能力引入其 Workspace 产品,这意味着用户可以在文件中向模型询问有关工作的问题。Perplexity 也增加了使用内部文档作为数据源的功能。
控制和定制
OpenAI 表示,对于某些用户来说,数据源的控制方式会有所不同。
虽然只有管理员可以添加数据连接器,但小型团队的用户可以配置 ChatGPT 何时访问内部知识库以及访问哪些云盘。然而,对于较大的团队,需要管理员决定可以访问哪些共享的 Google Drive。
OpenAI 表示,对于许多常见的提示,ChatGPT 知道何时访问连接的数据源。用户仍可以在消息编辑器中选择"内部知识"。
该公司表示,ChatGPT "完全遵守现有的组织设置和权限",因此没有特定云盘或文档访问权限的用户无法强制 ChatGPT 读取这些内容。
好文章,需要你的鼓励
斯坦福大学研究团队开发了名为BrainSynth的AI系统,通过生成式AI技术创建解剖学上合理的3D大脑MRI影像。该项目由精神病学和行为科学教授Kilian Pohl博士主导,旨在通过AI生成的合成数据来研究大脑疾病的细微影响。研究显示,超过一半的合成MRI脑区域在解剖学上是合理的,能够准确编码年龄和性别等生物因素的影响,为神经科学研究提供了宝贵的数据资源。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
ETH苏黎世和迪士尼研究院联合开发的HiGS技术,通过巧妙利用AI绘画过程中的历史信息,实现了图像生成速度6-8倍提升的同时保持更高质量。这项即插即用的技术无需重新训练模型,在ImageNet数据集上创造新纪录,为AI图像生成领域带来重要突破,具有广泛的实际应用价值。