大型生成式AI公司的高管们经常声称他们的产品将取代大量工人。Anthropic首席执行官Dario Amodei在5月时表示,生成式AI可能在未来几年内消除一半的入门级白领工作岗位。Meta首席执行官Mark Zuckerberg在4月表示,他希望AI能在明年完成公司一半的代码编写工作。美国人也相信这一点——皮尤调查发现,64%的美国人预计AI会导致就业机会减少。
在这种环境下,看到关于AI对工作威胁的研究很容易引起恐慌。当微软研究人员在7月发布报告,详细列出了与生成式AI任务重叠度最高和最低的工作岗位时,排在榜首的职业引发了从业者的担忧。但深入了解后会发现,翻译员、历史学家等职业的从业者无需过分担心AI会取代他们——除非被AI炒作冲昏头脑的雇主做出这样的决定。
布鲁金斯学会技术创新中心高级研究员Darrell M. West表示:"我认为人们关注具体任务而非整个工作岗位是有益的。可能不会有那么多完整的工作岗位被淘汰,但确实会有很多具体任务被淘汰。"
微软的研究报告也明确表达了这一观点,尽管这并非引发关注的重点。研究人员写道:"很容易得出结论认为与AI活动高度重叠的职业会被自动化,从而面临失业或降薪威胁……这是错误的,因为我们的数据不包括新技术的下游商业影响,这些影响很难预测且往往违反直觉。"
即使是生成式AI领域的顶级人物,在被追问时也会承认这种不确定性。OpenAI首席执行官Sam Altman在最近的播客节目中表示,不久之前很难想象人们会从事AI公司首席执行官和播客主持人这样的工作。"我认为很难准确预测事物如何演进,或准确预测未来会有什么样的工作岗位。"
认为AI能做它实际无法胜任的工作是有风险的。以下通过微软报告中提到的与AI任务重叠度最高的两个职业——翻译员和历史学家——来具体分析。
翻译不仅仅是找到正确的词汇
西班牙语是全球20多个国家的官方语言,这意味着存在20多种不同的语言变体。法律翻译员、美国翻译协会当选主席Andy Benzo深知这些区别的重要性。她说:"我说的是阿根廷语,不是'西班牙语'。根本就没有统一的'西班牙语'。"
作为律师出身的专业翻译,Benzo不仅要理解基本的西班牙语词汇,还要理解其背后的文化——以及法律文化。她的工作不是简单地将词汇和句子从一种语言转换为另一种语言,而是要确保含义准确。这些翻译可能对法律程序中的当事人产生严重影响,准确传达确切含义至关重要。
翻译员的工作不仅仅是转录和转换文档。医疗翻译帮助患者与医护人员沟通,确保他们得到适当的治疗,这是生死攸关的情况。跨语言的金融交易需要表达清晰,否则可能危及他人的资金或生计。
专业翻译员通常不仅是语言专家,也是特定领域的专家。Benzo说:"你付费购买的是我们的专业知识。我们承诺工作的准确性。"
由生成式AI驱动的翻译工具在帮助人们用不熟悉的语言交流方面越来越熟练。苹果iOS 26和谷歌Gemini展示了手机实时翻译功能。但专业翻译员和口译员专注于确保完全准确。当涉及金钱或生命时,你不希望得到AI的"合理推测",而是需要理解语言细微差别的翻译,以及在出错时承担责任的人。
"如果AI犯错误,谁来承担责任?"Benzo问道。
语言也不是静态的。虽然AI行业发展迅速,但语言变化更快。每天都有人创造新的表达方式。例如,《剑桥词典》刚刚添加了"skibidi"和"broligarchy"等新词,使用过时训练数据的AI可能无法理解。但经过适当训练的人类可以跟上这些微妙的变化。
"语言一直在演进,语言属于人民。没有人是语言的老板。只有人类才能感知语言的细微差别。"Benzo说。
历史研究不仅仅是重复旧故事
历史学家Sarah Weicksel的研究很难在书中找到,因为她研究的不是文字而是服装——不是你在网上看到定向广告的那种服装。她的工作(包括即将出版的书)研究美国内战时期的实物服装,以及它们如何反映当时的经济和政治环境。研究160年前的服装需要深入档案馆很少展出的部分,还需要查阅日记和其他历史文献,寻找关于裤子和衬衫而非重大历史事件的记录。
现任美国历史协会执行主任的Weicksel告诉我:"我的研究过程很像拼图。"
但AI模型难道不能查看博物馆的服装收藏或阅读所有内战日记吗?不完全是。历史学家的工作不是发现显而易见的事实,而是发现表面之下的潜在故事。Weicksel通过观察服装来考虑外套的剪裁如何帮助人们站得更直,或不同织物的质地。"AI无法为我触摸和感受这些物品。"她说。
更重要的是,Weicksel通过尝试回答和理解可能从未被提出过的具体问题来进行研究。这是历史学家工作的核心:运用判断力和创造力发现对过去的新解释。
Weicksel表示,像微软这样研究AI如何处理专业历史学家个别任务的研究并未涵盖全貌。是的,历史学家会维护和编辑文档,为人们提供信息,但这些任务"不是历史学家工作的核心"。
"我们不只是完成一系列任务并产生离散成果的人。我们的核心能力是综合、语境化以及为我们提出的问题带来判断力和创造力。"Weicksel说。
大语言模型可以为你提供相当不错的历史事件报告。向ChatGPT询问1618年布拉格抛窗事件的报告,你可能会得到很好的总结——除非它出现幻觉,将其与1419年和1483年在布拉格发生的其他抛窗事件混淆。但期望AI能做历史学家的工作,仅仅因为它能总结或分析历史事件,这是本末倒置的。AI能够总结历史事件,是因为它站在历史学家的肩膀上,而历史学家挖掘了事实并记录了发生的事情。
历史研究有助于我们对过去的理解不断发展,但被训练遵循过去趋势的机器可能无法发现意外情况或帮助我们避免重复同样的错误。
"伟大的历史著作既不可预测也不显而易见,这就是它们具有变革性的原因。这无法被训练用于重现现有模式的技术所取代。"Weicksel说。
AI能做什么样的工作?
AI能做的任务和AI能协助的任务之间存在差异。大语言模型已被证明擅长编写软件代码,导致"氛围编程"的兴起,在这种模式下,人类更多地负责构思想法和故障排除,而AI承担大部分工作。AI也越来越多地用于客户服务等角色,更直接的请求可以由聊天机器人处理,只有更复杂的问题才交给人类。
斯坦福大学研究人员最近的论文发现,在某些自动化敏感行业中,年轻的早期职业工作者就业率下降,这些下降主要集中在任务可以自动化的角色中。
"虽然我们发现在AI主要自动化工作的职业中,年轻工作者的就业率下降,但在AI使用最具增强性的职业中,我们发现就业增长,"研究人员写道,"在这些职业中,AI可以让人类更快或更有效,而不是取代他们。这些发现与AI的自动化用途替代劳动力而增强用途不会的观点一致。"
在例行任务可以自动化的地方,工作岗位替代已经在发生。West告诉我,许多软件开发人员被裁员,因为这项工作可以相当可靠地由AI完成。"大多数工作都会受到AI影响,但不是每个工作都会被取代。人们应该审视任何工作的具体任务,思考自动化的可能性。"
AI对就业的影响将由人而非技术潜力决定
最重要的是,没有人知道AI在未来几年对经济会产生什么影响。ChatGPT直到2022年才成为家喻户晓的名字。这些工具的能力以及我们对它们能做什么和不能做什么的理解在不断变化。
但技术对就业的影响不一定取决于它能做什么,而取决于商业领导者和高管认为它能做什么。目前,许多高管似乎更担心错过使用AI削减工作岗位和节省成本的机会,而不是担心AI无法胜任工作。例如,Klarna在2024年表示其AI助手可以完成700名客户服务代表的工作,但今年早些时候改变了主意,在没有得到预期结果后雇用了更多人类员工。
对企业主导的AI倡议的效果已经存在一些质疑。MIT研究人员7月的研究发现,95%的企业AI试点项目没有获得投资回报——主要因为AI工具不像人类员工那样学习、成长和发展。
"企业领导者可能会因为对AI过于乐观而裁掉太多员工,他们可能会发现缺少了重要元素。人类判断力方面将是关键。"West说。
人类元素——无论是判断力、创造力还是文化理解——可能证明是AI工具无法胜任某项工作的原因,即使在纸面上看起来它可能能够完成所有任务。
Q&A
Q1:为什么生成式AI无法完全取代翻译员?
A:专业翻译员不仅要理解语言的基本词汇,还要理解其背后的文化和专业领域知识。翻译涉及生死攸关或金钱利益时,需要完全准确的含义传达,而不是AI的"合理推测"。此外,语言在不断演进,只有人类才能感知语言的细微差别并承担翻译错误的责任。
Q2:历史学家的核心工作是什么,AI能替代吗?
A:历史学家的核心工作不是简单地维护文档或提供信息,而是运用判断力和创造力发现对过去的新解释。他们需要综合、语境化并为研究问题带来创造性思考。AI只能基于历史学家已经挖掘和记录的事实进行总结,无法进行实物触摸感知或提出原创性的研究问题。
Q3:哪些工作任务最容易被AI替代?
A:主要是可以自动化的例行任务最容易被AI替代,比如某些软件开发工作。相比之下,AI在需要增强人类能力而非完全替代的工作中表现更好。研究发现,在AI主要用于自动化的职业中就业率下降,而在AI起到增强作用的职业中就业率反而增长。
好文章,需要你的鼓励
科技亿万富翁拉里·埃里森资助的研究团队将向英国牛津大学投资1.18亿英镑,用于将AI技术应用于疫苗研究。牛津疫苗研究小组将领导这一项目,研究人体免疫系统对严重细菌感染和抗生素耐药性的反应。该项目由曾主导新冠疫苗试验的安德鲁·波拉德教授领导,计划采用人体挑战模型,让志愿者在受控条件下接触细菌,然后运用现代免疫学和AI工具来精确识别预测保护效果的免疫反应,以开发针对致命疾病的创新疫苗。
字节跳动团队开发了首个AI研究助手评估系统ReportBench,通过对比AI生成报告与专家综述论文的引用质量,并验证陈述准确性来评估AI助手表现。研究发现OpenAI Deep Research引用准确率38.5%,Gemini为14.5%,两者都存在陈述和引用幻觉问题。该系统为AI研究助手建立了标准化质量检测工具,推动行业发展。
据报道,ChatGPT开发商OpenAI计划在印度建设一座耗电量超过1吉瓦的数据中心,目前正寻找当地合作伙伴。该设施预计可容纳至少5.9万片英伟达B200芯片。这可能是OpenAI全球数据中心计划的一部分,旨在为国际用户提供更低延迟服务。OpenAI CEO奥特曼将于下月访问印度,公司还计划年底前在新德里开设办事处。
台湾大学研究团队开发了MovieCORE数据集,这是首个专门训练AI深度理解电影内容的创新工具。该数据集通过多AI智能体协作生成复杂问题,采用认知分类法测量思维深度,99.2%的问答需要高层次思维。研究还开发了ACE增强技术,可将AI性能提升25%。实验显示现有AI在深度视频理解方面仍存在显著不足,为未来AI发展指明了方向。