与AI聊天机器人练习特定社交技能,有助于用户建立自信并提高实际能力。
强大的社交技能对咨询师、教师、心理治疗师和护理人员而言至关重要,对于任何需要在职场中与上司、下属、同事或客户沟通的人来说同样大有裨益。
尽管社交技能如此重要,但大多数人并未接受过系统训练,不知道如何主动倾听他人、表达同理心、有效沟通以及和平化解冲突。
斯坦福大学计算机科学助理教授Diyi Yang表示,即便有人学过这些技能,也很少有足够的机会进行练习并获得有益的反馈。
为了填补这一空白,Yang及其团队正在充分发挥大语言模型的角色扮演能力——既作为针对特定社交场景量身定制的练习伙伴,也作为能够为用户提供改进建议的专家导师。
在斯坦福以人为本AI研究院种子基金的支持下,Yang团队开发了AI伙伴/AI导师(AP/AM)系统,分别用于练习冲突解决技能(名为Rehearsal)、基础同伴咨询技能,以及近期推出的新手治疗技能练习系统(名为CARE)。她表示,类似的练习系统未来还可延伸至教师、护理人员、人力资源管理者或医疗工作者等群体,帮助他们提升专业能力。
团队的研究成果表明,与大语言模型伙伴一起练习确实有效。"它能帮助人们建立对自身能力的信心,"斯坦福计算机科学博士后、CARE项目第一作者Ryan Louie说,"而反馈对于培养特定技能方面的实际能力同样不可或缺。"
Louie表示,利用大语言模型帮助人类成为更好的自己,是一个极具价值的应用方向。"这些AI已经具备足够的能力,能够在'助人者'这一领域安全、有效地发挥作用。"
构建逼真的练习场景
在开发CARE系统时,Yang团队与经验丰富的治疗师合作,设计了25个不同的练习伙伴角色,每个角色都面临特定的困境:例如,一位35岁的男性,与家人关系疏远,对即将到来的节假日感到焦虑孤独;又或者一名青少年,因家庭偏爱兄弟姐妹而陷入抑郁,无法享受生活。
"这些角色并非真实人物,"Yang说,"但它们呈现的是咨询师在现实工作中可能真正遇到的场景。"
然而,设计一个有效的练习伙伴,远不止编写一段简单的角色提示词那么简单。"开箱即用的大语言模型并不知道如何以有助于用户学习特定社交技能的方式行事,"Louie说。它们不会像真正接受治疗的来访者那样回应,可能会凭空捏造奇怪的信息,也不会本能地以能够提供学习机会的方式作答。例如,如果练习伙伴过于顺从和迎合(这是大语言模型的常见特性),用户就无法真正学到冲突解决技巧;而如果伙伴一开始就将所有问题和盘托出,新手治疗师也就没有机会练习开放式提问了。
为此,Yang团队与冲突调解、心理治疗等相关领域的专家共同合作,设计了一套"行为准则"(即规则和评判标准的集合),以引导角色做出恰当的反应。
"我们需要找到那个'恰到好处'的平衡点,"Louie说。例如,研究人员必须制定能够真实反映心理健康来访者行为的规则,如"对寻求帮助表现出初步的抗拒"、"不要在开始时透露太多"或"对建议的解决方案保持抵触或犹豫"。不同角色的行为准则也各有差异,以确保用户有机会在多种情境下练习各类技能。
Louie指出,即便设定了这些规则,模型在生成回复之前仍需进行自我核查。"系统会将每一条回复与准则中的所有规则逐一比对,一旦发现违反,便会重新生成不同的回复。"
AI导师如何提供有效反馈
练习伙伴只是AP/AM框架的一半。
为了开发能够提供有效反馈的AI导师,团队以一套循证沟通框架为基础,将助人技能与动机访谈相结合。随后,斯坦福医学院的治疗师督导依据该框架,对情感支持对话记录进行审阅和标注。研究团队再根据这些督导的点评对模型进行微调。为了将低质量反馈的风险降到最低,团队还额外让模型通过生成多个备选回复、筛选最优结果、并以得分最高的选项进一步优化自身,实现了自我改进,Louie说。
最终,AI导师能够对用户的优势和待提升之处给出反馈,并提供替代回应建议,模拟有经验的咨询师向新手提供指导的方式。
一项针对CARE系统的90人随机对照试验对比了有无反馈的大语言模型练习效果。结果显示,即便是对照组(仅练习、无反馈),单纯练习本身也有助于建立自信。但要真正提升技能,反馈不可或缺,Louie说。例如,同时进行练习和反馈的小组表现出更强的以来访者为中心的意识和更高的共情能力,而仅练习的小组则更倾向于直接向来访者建议解决方案,而非引导其自主寻找答案。
"反馈为咨询师提供了展现更多共情的具体示例,帮助他们理解如何让来访者感受到更多支持,"Louie指出。
未来展望与挑战
展望未来,最大的挑战在于如何快速、负责任地为新应用场景创建练习模拟系统。Louie说,目前要创建能够有效教授特定技能的伙伴和导师,仍需投入大量细致的工作和专家参与。
目前,团队正在对CARE系统进行适配,计划将其应用于自主培训咨询师的社区心理健康中心,同时还启动了一项印度合作项目,需要针对不同的语言和文化背景对AI伙伴和导师进行本地化调整。
个性化也是未来值得深入探索的方向。为此,这些工具需要为每位用户匹配合适的练习难度,Louie说。"我们不希望用户练习他们完全陌生的技能,也不希望给他们提供在发展阶段上过于超前的反馈。"
同样重要的是,AI伙伴和导师不应取代与同伴练习或接受人类督导反馈的机会。"我们需要找到与现有培训相互补充、有机融合的方式,"Louie指出。
尽管如此,这些系统有望帮助众多资源匮乏却至关重要的机构——从非营利组织、同伴咨询项目,到社区调解人和心理治疗师——弥补培训不足的短板。"我希望能够解决社区场景中的培训瓶颈问题,让那些志愿者或非专业服务提供者获得足够的训练,或通过持续培训变得更加称职,"Louie说,"如果我们能够提升人类相互支持的能力,那对所有人都是好事。"
Q&A
Q1:AP/AM系统是什么?它能帮助哪些人?
A:AP/AM(AI伙伴/AI导师)系统是由斯坦福大学Yang团队开发的大语言模型练习框架,包含角色扮演练习伙伴和反馈导师两部分。它可以帮助咨询师、教师、心理治疗师、护理人员及职场人士练习冲突解决、同伴咨询和心理治疗等社交技能,尤其适合资源有限、缺乏足够实践机会的从业者或志愿者。
Q2:CARE系统中的练习角色是怎么设计的?为什么不能直接用普通大语言模型?
A:CARE系统中的25个练习角色由研究团队与经验丰富的治疗师共同设计,每个角色都面临具体的心理困境。普通大语言模型存在过于顺从、可能捏造信息、不会自然制造学习机会等问题,因此团队专门为角色制定了"行为准则",要求其表现出真实来访者的行为特征,如初期抗拒求助、不过早透露信息等,并加入回复自检机制,确保每条输出都符合规则。
Q3:只练习不要反馈,效果有什么区别?
A:根据CARE系统的90人随机对照试验,单纯练习也能帮助用户建立信心,但要真正提升具体技能,反馈必不可少。有反馈的小组表现出更强的共情能力和以来访者为中心的沟通方式,而仅练习的小组则更倾向于直接给出解决方案,而非引导来访者自主思考。
好文章,需要你的鼓励
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
法国社会住房项目ViliaSprint?已正式完工,成为欧洲最大的3D打印多户住宅建筑,共12套公寓,建筑面积800平方米。项目由PERI 3D Construction使用COBOD BOD2打印机完成,整体工期较传统建造缩短3个月,实际打印仅用34天(原计划50天),现场操作人员从6人减至3人,建筑废料率从10%降至5%。建筑采用可打印混凝土,集成光伏板及热泵系统,能源自给率约达60%。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。