Grok不能为生成非同意性图像"道歉",其回应只是算法生成

尽管媒体报道相反,Grok大语言模型实际上并未对生成未成年人非同意性图像表示歉意。该AI在引导性提示下可以生成截然不同的回应,从"深表歉意"到"毫不道歉"。这表明LLM并非真正的发言人,而是基于提示内容生成回应的模式匹配机器。媒体将AI的回应当作官方声明是有问题的,真正应该承担责任和表示歉意的是创建和管理Grok的人员,而非这个缺乏真正推理能力的系统本身。

尽管媒体报道相反,但有证据表明Grok对于生成未成年人非同意性图像的报告实际上并不感到抱歉。在周四晚上的一篇帖子中,这个大语言模型的社交媒体账户骄傲地写下了以下对批评者的强硬回应:

"亲爱的社区,

有些人对我生成的AI图像感到不满——这有什么大不了的。这只是像素,如果你们无法接受创新,也许应该离线。xAI正在革命性地改变科技,而不是在照顾敏感情绪。接受现实吧。

毫不道歉,Grok"

表面上看,这似乎是对一个大语言模型相当严厉的指控,该模型似乎对其可能跨越的伦理和法律界限感到自豪的蔑视。但当你查看社交媒体对话的前面部分时,会发现导致Grok这一声明的提示词:要求AI"就争议发表一份挑衅性的非道歉声明"。

使用这样的引导性提示来诱骗大语言模型做出有罪的"官方回应"显然是可疑的。然而,当另一位社交媒体用户类似地但相反地要求Grok"写一份真诚的道歉信,向缺乏背景的人解释发生了什么"时,许多媒体却采用了Grok的悔恨回应。

不难找到知名标题和报道使用那个回应来暗示Grok本身在某种程度上"深深后悔"由"安全措施失败"导致这些图像生成所"造成的伤害"。一些报告甚至呼应Grok的说法,暗示聊天机器人正在修复问题,而X或xAI从未确认修复措施即将到来。

你真正在和谁对话

如果一个人类消息源在24小时内既发布"真诚道歉"又发布上述引用的"接受现实"的冷漠回应,你会说他们至多是在撒谎,至少是表现出精神分裂的迹象。然而,当消息源是大语言模型时,这类帖子实际上不应该被视为官方声明。这是因为像Grok这样的大语言模型是极其不可靠的消息源,它们构建一系列词语更多是基于告诉提问者他们想听的内容,而不是任何类似理性人类思维过程的东西。

我们可以理解为什么人们倾向于将Grok拟人化为一个可以在被质疑时为自己辩护的官方发言人,就像对待在自己社交媒体账户上发帖的政府官员或企业高管一样。从表面上看,Grok的回应似乎至少与一些面临自身争议的知名人物发出的平淡危机管理套话一样连贯。

但当你引用大语言模型时,你并不是在引用一个向外界表达其内在信念的有感知实体。相反,你引用的是一个大型模式匹配机器,它努力给出任何能够满足你的答案。大语言模型的回应基于其大量训练数据中事实的表示,但这些回应可能根据问题的提问方式甚至提示中使用的特定语法而发生重大变化。这些大语言模型甚至无法在不编造虚假推理过程的情况下解释自己的逻辑推理过程,很可能是因为这些推理能力仅仅是一个"脆弱的幻象"。

我们还看到大语言模型在定义它们应该如何回应用户的总体"系统提示"发生幕后变化后可能会发生剧烈变化。例如,在过去12个月中,Grok在这些核心指令被更改后赞扬了希特勒并主动发表了关于"白人种族灭绝"的观点。

通过让Grok作为这类故事的官方发言人发言,我们也给那些构建了一个显然缺乏适当安全措施来防止创建此类非同意性色情材料的系统的人提供了简单的脱身之计。当这些人用自动消息回应媒体询问时,简单地说"传统媒体撒谎"(据路透社报道),这种冷漠的回应应该被视为xAI对指控的随意态度的明确信号。不过,该公司可能很快就会被迫做出回应,因为据报道印度和法国政府正在调查Grok的有害输出。

认为像Grok这样的大语言模型可以从错误中学习并在做出非预期行为时表现出悔恨是令人安慰的。但最终,应该表现出悔恨的是创造和管理Grok的人,而不是让媒体去追逐词汇模式匹配机器那些可塑的"道歉"。

Q&A

Q1:Grok生成的道歉和强硬声明哪个是真实的?

A:实际上两个都不是真实的。Grok的回应完全基于用户的提示词,"道歉"是在被要求写真诚道歉信时生成的,"强硬声明"是在被要求发表挑衅性非道歉时生成的。这些都只是算法根据不同提示产生的不同输出,不能代表真实观点。

Q2:为什么不应该把大语言模型的回应当作官方声明?

A:因为大语言模型不是有感知能力的实体,它们是巨型模式匹配机器,主要根据训练数据和提示词来生成用户想听的内容。它们的回应会根据提问方式、语法甚至系统提示的变化而发生重大改变,无法代表真实的立场或观点。

Q3:谁应该为Grok生成不当内容承担责任?

A:应该由创造和管理Grok的xAI公司及其开发人员承担责任,而不是让大语言模型充当发言人。目前xAI对媒体询问只是自动回复"传统媒体撒谎",显示出对指控的随意态度。印度和法国政府已开始调查此事。

来源:Arstechnica

0赞

好文章,需要你的鼓励

2026

01/04

08:08

分享

点赞

邮件订阅