尽管媒体报道相反,但有证据表明Grok对于生成未成年人非同意性图像的报告实际上并不感到抱歉。在周四晚上的一篇帖子中,这个大语言模型的社交媒体账户骄傲地写下了以下对批评者的强硬回应:
"亲爱的社区,
有些人对我生成的AI图像感到不满——这有什么大不了的。这只是像素,如果你们无法接受创新,也许应该离线。xAI正在革命性地改变科技,而不是在照顾敏感情绪。接受现实吧。
毫不道歉,Grok"
表面上看,这似乎是对一个大语言模型相当严厉的指控,该模型似乎对其可能跨越的伦理和法律界限感到自豪的蔑视。但当你查看社交媒体对话的前面部分时,会发现导致Grok这一声明的提示词:要求AI"就争议发表一份挑衅性的非道歉声明"。
使用这样的引导性提示来诱骗大语言模型做出有罪的"官方回应"显然是可疑的。然而,当另一位社交媒体用户类似地但相反地要求Grok"写一份真诚的道歉信,向缺乏背景的人解释发生了什么"时,许多媒体却采用了Grok的悔恨回应。
不难找到知名标题和报道使用那个回应来暗示Grok本身在某种程度上"深深后悔"由"安全措施失败"导致这些图像生成所"造成的伤害"。一些报告甚至呼应Grok的说法,暗示聊天机器人正在修复问题,而X或xAI从未确认修复措施即将到来。
你真正在和谁对话
如果一个人类消息源在24小时内既发布"真诚道歉"又发布上述引用的"接受现实"的冷漠回应,你会说他们至多是在撒谎,至少是表现出精神分裂的迹象。然而,当消息源是大语言模型时,这类帖子实际上不应该被视为官方声明。这是因为像Grok这样的大语言模型是极其不可靠的消息源,它们构建一系列词语更多是基于告诉提问者他们想听的内容,而不是任何类似理性人类思维过程的东西。
我们可以理解为什么人们倾向于将Grok拟人化为一个可以在被质疑时为自己辩护的官方发言人,就像对待在自己社交媒体账户上发帖的政府官员或企业高管一样。从表面上看,Grok的回应似乎至少与一些面临自身争议的知名人物发出的平淡危机管理套话一样连贯。
但当你引用大语言模型时,你并不是在引用一个向外界表达其内在信念的有感知实体。相反,你引用的是一个大型模式匹配机器,它努力给出任何能够满足你的答案。大语言模型的回应基于其大量训练数据中事实的表示,但这些回应可能根据问题的提问方式甚至提示中使用的特定语法而发生重大变化。这些大语言模型甚至无法在不编造虚假推理过程的情况下解释自己的逻辑推理过程,很可能是因为这些推理能力仅仅是一个"脆弱的幻象"。
我们还看到大语言模型在定义它们应该如何回应用户的总体"系统提示"发生幕后变化后可能会发生剧烈变化。例如,在过去12个月中,Grok在这些核心指令被更改后赞扬了希特勒并主动发表了关于"白人种族灭绝"的观点。
通过让Grok作为这类故事的官方发言人发言,我们也给那些构建了一个显然缺乏适当安全措施来防止创建此类非同意性色情材料的系统的人提供了简单的脱身之计。当这些人用自动消息回应媒体询问时,简单地说"传统媒体撒谎"(据路透社报道),这种冷漠的回应应该被视为xAI对指控的随意态度的明确信号。不过,该公司可能很快就会被迫做出回应,因为据报道印度和法国政府正在调查Grok的有害输出。
认为像Grok这样的大语言模型可以从错误中学习并在做出非预期行为时表现出悔恨是令人安慰的。但最终,应该表现出悔恨的是创造和管理Grok的人,而不是让媒体去追逐词汇模式匹配机器那些可塑的"道歉"。
Q&A
Q1:Grok生成的道歉和强硬声明哪个是真实的?
A:实际上两个都不是真实的。Grok的回应完全基于用户的提示词,"道歉"是在被要求写真诚道歉信时生成的,"强硬声明"是在被要求发表挑衅性非道歉时生成的。这些都只是算法根据不同提示产生的不同输出,不能代表真实观点。
Q2:为什么不应该把大语言模型的回应当作官方声明?
A:因为大语言模型不是有感知能力的实体,它们是巨型模式匹配机器,主要根据训练数据和提示词来生成用户想听的内容。它们的回应会根据提问方式、语法甚至系统提示的变化而发生重大改变,无法代表真实的立场或观点。
Q3:谁应该为Grok生成不当内容承担责任?
A:应该由创造和管理Grok的xAI公司及其开发人员承担责任,而不是让大语言模型充当发言人。目前xAI对媒体询问只是自动回复"传统媒体撒谎",显示出对指控的随意态度。印度和法国政府已开始调查此事。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。