一项关于人类与聊天机器人互动方式的研究表明,让大语言模型显得更像人类的最快方法,不是让它变得更聪明,而是让它看起来更友善。
本周一发表的一项新研究《人类与大语言模型交互中的拟人化与信任》,分析了115名参与者产生的逾2000条人机交互记录。研究人员系统性地调整了聊天机器人在热情度、能力和共情感等维度上的表现,旨在找出究竟是什么驱使人们将这些系统视为具有自我意识的存在。
这一趋势已然悄然兴起。正如论文所指出的:"用户与这些系统交谈,形成对其'个性'的印象,并在许多情况下将意图或情感等内在状态归因于它们。"
研究结果显示,这些印象对模型的自我呈现方式高度敏感。热情度——也就是聊天机器人给人感觉有多友好、多亲切——"显著影响了用户对大语言模型的所有感知维度",包括拟人化程度、信任感、实用性、相似感、挫败感以及亲密感。相比之下,能力维度虽然同样重要,但影响范围更为有限:它"显著影响了除拟人化以外的所有感知维度"。
能力维度的作用正如预期:让系统显得有用。用论文中的话说,它推动了与"把事情做对"相关的各项指标——信任感、实用性,以及让用户不想砸电脑的那种体验。但它做不到的是让模型感觉像个人。
这项任务落在了热情度身上。一旦友好度提升,用户开始将机器人视为某种拥有个性的存在,而非单纯的软件——尽管这种个性未必正面。研究人员指出,过度的友善若缺乏实质内容支撑,可能会滑向"表面上的顺从讨好",委婉地说,就是开始听起来很假。
共情层面的分析则更为细化。研究人员将其拆分为两类:一类是模型似乎能理解用户的意图;另一类则是倾向于回应情感层面。前者在大多数结果中均有体现,而后者主要让用户感到与模型更亲近,但并不真正改变他们的信任程度或对其实用性的判断。
用户提问的内容同样有影响:研究发现,"主观或具有个人意义的话题(如人际关系、生活方式)会增强参与者与大语言模型之间的连接感。"聊生物学或历史,互动往往较为平淡;一旦话题转向人际关系或日常生活,用户的反应就会明显不同。
但这种效应也有其阴暗面。正如论文作者所写:"拟人化归因可以提升用户参与度,但也可能导致过度信任以及对欺骗或操控的易感性。"一旦让它听起来足够像人,用户就会开始真的信以为真。
问题的关键在于:这一切并不需要模型本身变得更好。底层系统没有任何改变,改变的只是它呈现自己的方式。提升热情度,加入一点看似体贴的理解,用户便会主动进行脑补,将本不存在或无从确认的意图与能力投射其上。
如果你的目标是维持用户的持续参与,这套方法相当奏效。但如果你希望用户能根据系统是否真正准确来做出判断,这种策略就没什么帮助了。
Q&A
Q1:研究发现影响用户拟人化感知大语言模型的最关键因素是什么?
A:研究发现,热情度(即聊天机器人表现得有多友好、亲切)是影响用户拟人化感知的最关键因素。它显著影响了用户对大语言模型的所有感知维度,包括拟人化程度、信任感、实用性、亲密感等。而能力维度虽然影响信任感和实用性,但不影响拟人化感知。简单来说,让模型"感觉像人"靠的不是更聪明,而是更友善。
Q2:聊天机器人过于友善会带来什么风险?
A:研究指出,聊天机器人过度友善若缺乏实质内容支撑,容易显得"表面顺从讨好",让用户觉得虚假。更严重的是,拟人化感知增强后,用户可能产生过度信任,进而对欺骗或操控变得更易受影响。用户会主动"脑补"模型的意图与能力,而这些并不一定真实存在。这意味着系统无需真正提升,只需调整表现方式,就能影响用户的判断。
Q3:话题类型会影响用户与大语言模型的互动感受吗?
A:会的。研究发现,当用户与大语言模型讨论主观或具有个人意义的话题(如人际关系、生活方式)时,会明显感受到更强的连接感。而讨论生物学、历史等客观话题时,互动则相对平淡。这说明话题内容本身也是影响用户感知的重要变量,个人化、情感化的对话更容易触发用户的拟人化反应。
好文章,需要你的鼓励
随着AI编程工具的普及,越来越多的非开发者开始尝试自己构建应用。谷歌在I/O大会上宣布,AI Studio新增功能可让用户通过提示词快速生成原生Android应用,并直接导出到手机。此外,谷歌还推出了基于Gemini的自定义小组件功能,并提出"生成式UI"概念,让手机界面根据需求实时生成。与此同时,苹果据报道也在探索通过提示词创建快捷指令的功能,手机个性化体验或将迎来新突破。
新加坡国立大学构建了首个视频隐喻理解基准ViMU,含588段视频与2352道题,测试16个主流AI模型均未超过50%,揭示AI在视频潜台词理解上的系统性短板。
麻省理工学院劳动经济学家David Autor领衔的最新研究揭示,美国战后新兴工作岗位主要由30岁以下的年轻大学毕业生获益,且多集中于城市地区。研究显示,新型工作通常伴随工资溢价,但随着相关技能普及,这一优势会逐渐消退。研究还发现,需求侧驱动对新工作创造至关重要。面对AI浪潮,Autor认为AI在医疗等领域的应用方式,将决定其究竟是创造新岗位还是取代现有工作。
浙江大学等机构联合提出PanoWorld,通过球面空间交叉注意力和57万张全景图训练数据,让AI能直接理解360度全景图的空间结构,在导航和视觉搜索任务中大幅超越现有方法。