文学界还没准备好迎接AI的冲击
三起近期丑闻所折射出的,与其说是大语言模型写作水平的高低,不如说是出版行业本身的深层问题。
自2012年起,英国文学杂志《格兰塔》每年都会刊登"英联邦短篇小说奖"各地区获奖作品。然而今年,这一权威奖项的某篇入选作品却显得疑点重重——它似乎出自AI之手。
贾米尔·纳齐尔的作品《林中蛇影》带有大量大语言模型生成文本的典型特征:混用比喻、反复排比、惯用三段式列举。(我知道这句话本身也用了三段式列举,但我保证这篇文章完全出自本人之手,一如我所有的写作。)坦率地说,我起初对纳齐尔的故事系AI生成这一说法持怀疑态度。我知道有人在用大语言模型辅助写作,甚至直接让它代劳,但我也一直警惕同行中蔓延的那种AI疑神疑鬼的风气。破折号被认为是AI的惯用手法,"深入探讨"这个词也是,还有前面提到的三段式列举。此外还有短句的连续使用,尤其是在一系列长句之后突然插入一个简短有力的句子。
但说实话,我作为一个人类写作者,以上这些手法我都用过。大语言模型本就是在人类写作上训练出来的,它们不过是在反映自己所"消化"的内容。尽管如此,AI生成的文字确实有一种奇异感——即便你一时说不清哪里不对,就是感觉有什么东西不太对劲。如果说AI有某些惯用的写作标志,而我现在也正在使用这些标志,那你又怎么确定这篇文章真的是我写的呢?
曾任乔治梅森大学麦卡托斯中心AI访问学者的纳比尔·S·库雷希,是最早指出纳齐尔故事疑似使用AI的人之一。在他看来,开头两句话就已经足够说明问题了。
"他们说那片树林在正午时分仍会嗡嗡作响。不是蜜蜂勤劳的嗡鸣,也不是砍刀划破空气的清脆声响,而是一种来自腹腔深处的声音——仿佛大地吞下了一声呐喊,然后将它压在那里。"
"总体而言,AI写作有一种特定的节奏,我已经学会辨别,但很难描述,"库雷希通过邮件告诉我,"从'AI帮我修改'到'AI代我写作',存在一个连续的谱系——这个案例在我看来更接近后者,当然我并不能百分之百确定。"
问题在于,即便AI使用嫌疑已被广泛怀疑,我们谁也无法真正确认。英联邦基金会总干事拉兹米·法鲁克在一份声明中表示,该机构已知悉有关获奖作品中使用AI的指控,包括针对纳齐尔的质疑。他表示,所有投稿者在提交作品时均被要求确认所提交的是原创未发表作品,而所有入围作者也均亲口声明,其作品并未借助AI起草。
"在一个既能可靠检测AI使用情况、又能应对未发表虚构作品特殊挑战的工具或流程出现之前,基金会和英联邦短篇小说奖只能在信任原则的基础上运作,"法鲁克表示。
《格兰塔》方面则表示,他们将纳齐尔的故事输入了Claude,"询问它是否由AI生成",出版人西格里德·劳辛在声明中说道,"得到的回复很长,最终结论是它'几乎可以肯定不是完全由人类独立完成的'。"但Claude并不是AI检测工具,它是一款由大语言模型驱动的聊天机器人。尽管AI工具在检测大语言模型生成文本方面通常比人类读者——至少比那些担任文学奖评委的人——更为可靠,但《格兰塔》的声明暗示他们是去问源头本身,来判断这个故事是否由AI生成,这恰恰表明这家杂志自身也许并不真正了解AI的工作原理。
"有可能评委们已经将奖项颁给了一篇AI剽窃之作——我们目前还不知道,也许永远无从知晓,"劳辛说道。
出版机构正越来越频繁地被骗,刊发由AI生成的故事,其中一些"作者"根本就是不存在的虚构人物。甚至有人怀疑纳齐尔本人也是假的——不过,上届英联邦短篇小说奖得主、作家凯文·贾里德·霍赛因证实纳齐尔确有其人,并分享了他近期与纳齐尔就AI使用质疑一事的往来消息。纳齐尔还于2018年出版过一部诗集。纳齐尔本人未回应《The Verge》的置评请求。今年3月,阿歇特出版社叫停了米娅·巴拉德恐怖小说《内向女孩》的出版,原因是作者被指控使用AI,尽管巴拉德否认这一说法,并将责任推给了一名受雇编辑。
此外,还有一个问题始终悬而未决:作家和记者究竟有没有任何合理使用AI的方式?大语言模型生成的文章显然是禁区,但用AI做创意发散或资料查询呢?用AI语音转录服务又如何?在哪个节点上,对这些工具的依赖意味着作品已不再属于你自己?本周,波兰作家奥尔加·托卡尔丘克承认她在创作过程中借助AI——这正是库雷希所说的AI使用谱系的另一端,对于那些敬仰这位诺贝尔文学奖得主的读者而言,无疑令人震惊。
"我经常会把一个想法丢给AI,然后输入提示词:'亲爱的,我们怎样才能把这个写得更美?'"托卡尔丘克说道,她于2018年荣获文学界最高荣誉:
"尽管我深知它的幻觉问题以及在定量经济学或事实数据方面的诸多错误,我还是必须承认,在文学虚构这片流动的领域里,这项技术拥有难以置信的撬动力量。与此同时,我内心涌起一种锐利的人类悲悯,为那个正在消逝、一去不返的时代而悲悯。让我心碎的,是那种在孤独中历经数月写就、在单一个体的意识中孕育成形的传统文学的远去。在这一切之中,我深深地哀悼巴尔扎克、齐奥朗,以及无可复制的纳博科夫,因为尽管我满怀热情,我仍不相信任何现代的聊天程序能够以他们那种精妙绝伦的方式开口说话。"
托卡尔丘克的这番话是在波兹南的一场活动上以波兰语发表的,不巧与英联邦奖争议同时发酵,随即在网上广泛传播。(我们委托人工翻译将她的话译成了英文。)但她对AI的态度,远比媒体报道所呈现的更为复杂和矛盾。托卡尔丘克随后在一份三点声明中向Lit Hub解释,她并未使用AI创作即将出版的新书,而是将其用于"更快速地记录和核查事实",但她会自行独立验证相关信息。
"我有时会从梦中获得灵感,"她补充道,"但在这句话也被专家们围攻撕碎之前,我赶紧申明:那些都是我自己做的梦。"
围绕托卡尔丘克最初言论的轩然大波——以及她感到有必要出面解释——折射出出版界对AI使用更深层次的、并非全无道理的焦虑。大语言模型生成的文字或许正在成为新常态,但这真的是人们想要的吗?当巴诺书店CEO詹姆斯·当特表示他不反对出售AI生成的书籍,只要书中注明并非由真人所写,就有数千人扬言抵制巴诺。当特后来有所收回,但并未完全改变立场。"禁书是一个迫在眉睫的威胁,所以我们对任何封禁书籍的要求都非常谨慎,"他告诉《洛杉矶时报》,同时也确保"不出售那些冒充真人著作的AI生成书籍"。
然而,这一切都无法解释AI生成作品那种奇异的特质,也无法说明劣质大语言模型文字与劣质人类写作之间的区别究竟在哪里。当我将纳齐尔的故事输入Pangram这款AI与剽窃检测软件时,结果显示100%由AI生成。据Pangram分析,最明显的特征是:纳齐尔惯用三段式结构;"stubborn"(顽固)这个词在AI生成文本中出现的概率是人类写作的六倍;而"as if it had"(仿佛它曾经)这一短语出现的概率则是人类写作的五倍。但这里我又写了一个三段式列举,而我是人类。
不甘心,我又把自己正在修改的待出版新书中一段未发表的节选输入Pangram。仅仅一个段落就包含了两个三段式结构。(这不是本书中最出彩的部分,这也正是我需要修改它的原因。)Pangram判定这段文字100%出自人类之手——这是实情——但我仍感到不满。我又提交了另一段节选——我认为那段写得更好——结果相同。当我将《The Verge》编辑凯文·阮的小说《我的文件》第一章输入Pangram,结果也一样。Pangram自己也将所有英联邦奖获奖作品过了一遍,结果发现2026年的两位获奖者以及2025年的获奖者,其作品似乎均由AI生成。人类创作有某种难以言说的特质,其反面亦然。也许AI生成的文字就像猥亵内容一样:你一眼就能认出来,哪怕说不清为什么。
Q&A
Q1:英联邦短篇小说奖涉嫌AI写作的争议是怎么回事?
A:2025年,贾米尔·纳齐尔的获奖作品《林中蛇影》被多人指出具有大语言模型生成文本的典型特征,如混用比喻、反复排比和三段式列举。英联邦基金会表示,所有作者均声明未使用AI,但在缺乏可靠检测工具的情况下,只能依赖信任原则运作。《格兰塔》将文章输入Claude询问,但Claude并非专业检测工具,此举反而暴露出出版界对AI工作原理的理解盲区。
Q2:现有的AI检测工具靠谱吗?
A:目前来看并不完全可靠。文章作者将疑似AI作品输入Pangram检测软件,结果显示100%由AI生成;但将自己亲手写的书稿片段同样输入,也得到100%人类写作的判定。真正令人担忧的是,Pangram还发现2025年及2026年英联邦短篇小说奖的多名获奖者的作品疑似由AI生成,说明问题已不是个例。
Q3:诺贝尔文学奖得主奥尔加·托卡尔丘克是怎么使用AI的?
A:托卡尔丘克承认会将创意想法输入AI,询问如何更好地展开表达,并用AI辅助核查事实。但她随后澄清,新书并非由AI写作,她只是将其作为辅助工具,且会独立核实AI提供的信息。她同时表达了对传统文学消逝的深切哀悼,认为没有任何聊天程序能真正复现巴尔扎克或纳博科夫的写作风格。
好文章,需要你的鼓励
TechCrunch创业战场并非寻找最成熟的公司,而是最具潜力的公司。我们关注具有颠覆性创意、能够定义品类的团队,而非现有产品的改良版。申请时需展示可运行的MVP产品、清晰阐述竞争优势和创始故事。种子轮前、预发布阶段的公司均可申请,曾被拒绝的团队也欢迎再次提交。申请截止日期为5月27日,入选公司将在10月旧金山Disrupt大会上展示。
卡内基梅隆大学研究发现,商业AI检测器识别的是指令微调痕迹而非AI写作本质,并提出迭代改写方法HIP,可系统性绕过GPTZero和Pangram等主流检测器。
云安全公司Zscaler第三季度营收和利润均超预期,并上调全年营收和利润指引,但因计划增加资本支出而大幅下调自由现金流预期,导致股价盘后暴跌超19%。截至4月30日的季度中,调整后每股收益1.08美元,营收8.505亿美元,同比增长25%。年度经常性收入增长25%至35.25亿美元。公司将全年自由现金流利润率指引从26.5%-27%下调至22.8%-23.3%,原因是资本支出占营收比例升至高个位数水平。
这项由亚利桑那州立大学主导的研究发现,在强化学习之前让语言模型学习同一道题的多种正确解法,能显著提升后续强化学习的效果,尤其在高难度数学和复杂推理任务上表现突出。