未来工作的统计数据层出不穷:一些研究指向麦肯锡等机构的研究,表明美国大部分工作时间可以实现自动化。而其他人则更多依赖对未来可能出现情况的直觉判断。
Anthropic在这一领域表现活跃,最近公布了一项开创性调查,不仅深入研究人们如何使用大语言模型,还探索了他们对此的感受。
为此,该公司创建了一个名为Clio的全新工具,在保护隐私的同时深入挖掘用户群体的详细信息。Anthropic在12月早些时候的博客文章中这样解释该项目:
"人们实际上如何使用Claude的输出?他们对此有何感受?他们如何想象AI在未来的角色?如果我们想要全面了解AI在人们生活中不断变化的角色,并将人类置于模型开发的中心,我们需要直接询问人们。"
接着提到了以这种方式使用AI的效率:
"这样的项目需要我们进行数百次访谈。在这里,我们利用AI来帮助我们完成这项工作。我们构建了一个名为Anthropic Interviewer的访谈工具。在Claude的支持下,Anthropic Interviewer能够以前所未有的规模自动进行详细访谈,并将结果反馈给人类研究者进行分析。"
对AI的情感态度
Clio工作的一个组成部分涉及情感调查;超过1200名专业人士为这一宏观视角做出了贡献。
据包括知名的AI Daily Brief播客在内的各种报道,前景大多是积极的,乐观情绪在各个领域都占据主导地位(播客的视频版本一目了然地展示了这些结果)——虽然有一些例外,比如担心被取代的创意工作者,但总体而言,人们正在使用AI。
主要使用场景
那么,考虑到这一点,用户希望从大语言模型中获得什么?
首先,研究人员发现(使用Clio),Claude.ai主要用于类似工作的任务,尤其是编程。大约10%的回答涉及"Web和移动应用程序开发",教育占7%;商业策略/运营接近6%。
至于回答中的职业分布,结果突出了这些类别:计算机和数学专业占37.2%;艺术和媒体占10.3%;教育和图书馆科学占9.3%;办公和行政占7.9%;生命科学占6.4%,商业和金融专业占5.9%。
在这种背景下,一些用户谈到了使用AI的"污名化"——这仍然是一个问题。销售人员和其他人发现,当收件人能够判断出他们使用AI发送消息时,反应可能非常负面。
"管理者同样基于自己的偏见做出决定——包括许多招聘选择,"Inc.com的Bruce Crumley在5月份写道,引用了杜克大学福卡商学院管理与组织研究。"许多(在研究中接受调查的)人认为使用AI的员工或候选人在某种程度上是懒惰的,或试图获得超越同事的优势。换句话说,不仅使用AI力量的工作者被看不起,而且在某些情况下,他们的努力会被边缘化。"
这是另一项相关研究,显示了更多的负面影响。
对Clio的反馈
一些研究Anthropic调查和Clio使用的人士表示,该工具似乎实现了研究人员所称的"半结构化数据收集"。
这意味着什么?
从某种意义上说,你可以将其描述为访谈方法(个人化和私人化)与调查(在受访者方面撒下广网)的结合。
但事实证明,半结构化数据收集是专业研究人员熟知的术语。
"半结构化访谈代表了结构化和非结构化方法之间的中间地带,"图书馆和信息管理学术博客的Harun ar Rashid写道。"这种方法涉及一套预先确定的开放式问题,允许访谈者灵活地探索额外主题或更深入地探讨特定回应。半结构化访谈在定性研究中备受重视,因为它们平衡了结构化访谈的一致性和非结构化访谈的深度,使其适用于广泛的研究。"
Q&A
Q1:Clio是什么?它有什么特殊功能?
A:Clio是Anthropic公司开发的一个全新调查工具,它能在保护用户隐私的同时深入挖掘用户群体的详细信息,帮助研究人们如何使用大语言模型以及他们对此的感受。
Q2:Claude.ai主要被用于哪些工作场景?
A:根据调查结果,Claude.ai主要用于工作相关任务,特别是编程。其中约10%的使用涉及Web和移动应用程序开发,7%用于教育,接近6%用于商业策略和运营。
Q3:使用AI工具在职场中会遇到什么问题?
A:调查发现使用AI仍存在"污名化"问题。一些管理者和同事认为使用AI的员工是懒惰的或试图获得不公平优势,这可能导致负面反应,甚至在招聘决策中受到歧视。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。