最近,OpenAI ChatGPT用户震惊地发现,他们的搜索记录竟然出现在了Google搜索结果中。你们这些蠢货!你们以为AI聊天机器人在做什么?免费帮你做作业,或者每月只收20美元?想得美!
当你向AI聊天机器人提问时,无论是关于关税在降价中的作用(剧透:关税实际上会提高价格);你的女朋友是否真的喜欢你;还是我最喜欢的问题"如何在不召唤撒旦的情况下使用微波炉",OpenAI都会记录你的问题。而且直到最近,Google还保留这些记录,任何懂搜索技巧的人都能找到它们。
OpenAI并非没有告知用户,如果你与他人分享查询内容或保存以备后用,公司会复制这些内容并使其可能被搜索到。公司明确表示这种情况正在发生。
警告内容是:"当用户点击'分享'时,他们会看到'使此聊天可被发现'的选项。在下方的小字说明中,解释了你允许这些内容'在网络搜索中显示'"。
但就像我们都用"同意"按钮勾选的那些数百行最终用户许可协议(EULA)一样,大多数人似乎都没有阅读它们。或者,没有仔细考虑。选一个吧,也许两个都是。汉隆剃刀原理说得最好:"永远不要将恶意归咎于可以用愚蠢解释的事情。"
OpenAI首席信息安全官Dane Stuckey随后在推特上表示,OpenAI已经移除了这个选项,因为它"为人们意外分享他们不想分享的内容创造了太多机会"。公司还"正在努力从相关搜索引擎中删除已索引的内容"。看起来OpenAI已经成功了。
那么,现在一切都好了,对吧?对吧?对吧!?哦,可怜的孩子,当然不是。
目前,没有人可以通过Google搜索到你向OpenAI提出的尴尬问题。但这并不意味着你一直在询问的查询不会因数据泄露而出现,或以某种方式在Google或AI搜索中重新浮现。毕竟,OpenAI在法律上被要求保留你的所有查询,包括那些你已经删除的。或者,你以为你删除了的那些。
哦?你不知道吗?OpenAI目前受到联邦法院命令的约束,作为正在进行的版权诉讼的一部分,这迫使它保留ChatGPT面向消费者层级的所有用户对话:免费版、Plus版、Pro版和团队版。法院命令还意味着以前使用后会被删除的"临时聊天"会话现在正在被存储。现在它们一点也不"临时"了。
看,这就是为什么你需要关注我,这样你才能跟上这些事情的最新进展。虽然我不认为你问ChatGPT的内容像推特上名为"signull"的用户说的那样重要,他们说"ChatGPT的内容往往比银行账户更敏感",但这仍然很重要。
你会很高兴知道OpenAI正在法庭上抗争,但作为一个报道过相当多法律案件的人,我不会指望他们在这一点上获胜。
顺便说一下,这不仅仅是OpenAI的问题。以Google为例。Google已经开始推出Gemini AI更新,使其能够自动记住过去聊天中的关键细节。Google希望你考虑的是,这意味着Gemini可以通过回忆你的偏好、以前的话题和早期对话中的重要背景来个性化其响应。
例如,Gemini会知道当我询问"狗零食"时,它会"回忆起"我之前问过西施犬的问题,所以它会给我小型犬零食的信息,而Google作为Google,还会提供相同产品的广告。
这不是很贴心和有用吗?
但是,假设它回忆起我询问如何制作3D打印枪支。你可能不希望这出现在你的永久AI记录中。顺便说一下,在OpenAI上,同样的功能被称为记忆,Anthropic也刚刚将其添加到Claude中。
在Google上,这个功能默认开启,但可以禁用。当然,人们必须启用OpenAI才能使他们的问题公开可搜索,而他们轻率地就这样做了。
这不仅仅是个人关注的问题。正如Anthropic最近指出的,大语言模型可以用来窃取数据,就像公司内部人员一样。你给任何AI服务的数据越多,这些信息就越有可能被用来对付你。记住,所有主流AI聊天机器人默认都会记录你的问题和对话。他们一直在这样做,用于服务改进、上下文保留、产品分析,当然,还有喂养他们的大语言模型。
现在不同的是,既然你已经习惯了AI,他们让你也从所有这些数据中受益,同时希望你不会注意到AI对你了解得有多深。我不敢想象Meta会做什么,它的AI政策允许聊天机器人与你的孩子调情。让我提醒你,Meta拒绝遵守欧盟的自愿AI安全指导原则。
所以,孩子们,让我们不要问任何AI聊天机器人你是否应该与丈夫离婚、如何逃税,或者是否应该试图让你的老板被解雇。这些信息将被保留,可能会在安全漏洞中被泄露,如果是这样,它会回来咬你的屁股。
Q&A
Q1:OpenAI ChatGPT用户的搜索记录为什么会出现在Google搜索中?
A:当用户点击ChatGPT的"分享"按钮并选择"使此聊天可被发现"选项时,OpenAI会将这些对话内容设为可在网络搜索中显示。虽然有警告说明,但大多数用户没有仔细阅读就同意了这个功能,导致他们的聊天记录被Google等搜索引擎索引。
Q2:删除ChatGPT对话记录就真的删除了吗?
A:不是的。OpenAI目前受到联邦法院命令约束,作为版权诉讼的一部分,必须保留所有用户对话记录,包括用户"删除"的内容。连原本使用后会被删除的"临时聊天"会话现在也在被存储,所以实际上没有真正的"临时"对话。
Q3:Google Gemini和其他AI聊天机器人的记忆功能安全吗?
A:这些记忆功能存在隐私风险。Google Gemini会自动记住过去聊天的关键细节来个性化响应,OpenAI的Memory功能和Anthropic的Claude也有类似功能。虽然可以禁用,但所有主流AI聊天机器人默认都会记录对话,这些数据可能在安全漏洞中被泄露或被滥用。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。