虽然AI的日常使用已经很普遍,但有一些可衡量的行为将AI技术的常规使用与真正复杂的人机交互区分开来。这是毕马威会计师事务所和德州大学奥斯汀分校联合研究的结论,该研究分析了来自2500名员工的140万次工作场所AI交互。
根据报告,这些行为可以转化为可教授的基准,在规模化推广时,可以通过专注于针对性培训和工作流程整合,而不仅仅是工具部署,来缩小AI影响差距。
"常规和复杂AI使用之间的差距并不隐藏在提示词本身,而是在参与模式中,"毕马威工作室负责人Anu Puvvada说。"一旦这些模式变得可见,它们就有可能被识别、讨论和规模化。"
根据报告,最复杂的AI用户不是由技术专业知识或使用频率来定义的,而是由他们如何与AI协作来定义的,这包括迭代、清晰地构建问题框架以及随时间引导输出。
这些用户不将AI视为短期生产力工具,而是长期的"思维伙伴"。
使用这些行为作为可教授指标的效果可能是变革性的,报告发现只有5%的工作者始终以能实质性改善其工作质量的方式使用AI。
研究结果还挑战了一个普遍假设,即改善AI结果主要是更好的提示词或更广泛的工具访问权限问题。相反,研究表明有效的人机协作源于员工如何将AI整合到他们的日常工作流程中。
复杂使用与四个信号密切相关:用户返回AI的频率、他们完善输出的持久性、初始请求的雄心以及选择工具或模型的意图性。
"我们在寻找那些已经弄清楚如何与模型一起思考,而不仅仅是向它提问的人,"德州大学奥斯汀分校会计学教授Jaime Schmidt说。
毕马威已经开始在内部应用这些见解,启动全公司培训计划以开始重塑行为。
该组织已将这些实践嵌入其学习生态系统中,通过基于角色的培训、操作手册和同行主导的网络,旨在强化其所谓的"AI优先"工作方式。
"我们很早就意识到,仅仅获得AI访问权限并不能带来更好的结果,"毕马威全球AI和数字创新负责人Steve Chase说。"这就是为什么我们有意设置了一套AI支持的工具、培训计划和例行程序,以使有效行为变得可见和预期,并教授更好的问题构建、更强的AI监督和有目的的迭代。"
对于首席信息官和IT领导者来说,研究结果表明AI成功更少依赖于扩大新工具规模,更多依赖于完善员工如何使用这些工具。
学习如何最好地使用这些工具包括定义什么是"良好"的AI使用,将这些行为嵌入培训和绩效期望中,并创建反馈循环,随时间推移强化更复杂的协作。
Q&A
Q1:这项研究发现了什么关键区别?
A:毕马威和德州大学奥斯汀分校的研究发现,AI使用的成功与否不在于提示词技巧,而在于用户如何与AI协作。最复杂的AI用户将AI视为长期"思维伙伴",通过迭代、清晰构建问题和引导输出来深度协作。
Q2:什么行为能体现复杂的AI使用?
A:研究发现四个关键信号:用户返回AI的频率、完善输出的持久性、初始请求的雄心程度,以及选择工具或模型的意图性。这些用户学会了与模型一起思考,而不仅仅是向它提问。
Q3:企业如何提升员工的AI使用效果?
A:企业应该专注于将有效的AI协作行为嵌入培训和工作流程中,而不仅仅是部署更多工具。包括定义"良好"的AI使用标准、基于角色的培训、创建反馈循环,以及强化AI优先的工作方式。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。