未来工作的统计数据层出不穷:一些研究指向麦肯锡等机构的研究,表明美国大部分工作时间可以实现自动化。而其他人则更多依赖对未来可能出现情况的直觉判断。
Anthropic在这一领域表现活跃,最近公布了一项开创性调查,不仅深入研究人们如何使用大语言模型,还探索了他们对此的感受。
为此,该公司创建了一个名为Clio的全新工具,在保护隐私的同时深入挖掘用户群体的详细信息。Anthropic在12月早些时候的博客文章中这样解释该项目:
"人们实际上如何使用Claude的输出?他们对此有何感受?他们如何想象AI在未来的角色?如果我们想要全面了解AI在人们生活中不断变化的角色,并将人类置于模型开发的中心,我们需要直接询问人们。"
接着提到了以这种方式使用AI的效率:
"这样的项目需要我们进行数百次访谈。在这里,我们利用AI来帮助我们完成这项工作。我们构建了一个名为Anthropic Interviewer的访谈工具。在Claude的支持下,Anthropic Interviewer能够以前所未有的规模自动进行详细访谈,并将结果反馈给人类研究者进行分析。"
对AI的情感态度
Clio工作的一个组成部分涉及情感调查;超过1200名专业人士为这一宏观视角做出了贡献。
据包括知名的AI Daily Brief播客在内的各种报道,前景大多是积极的,乐观情绪在各个领域都占据主导地位(播客的视频版本一目了然地展示了这些结果)——虽然有一些例外,比如担心被取代的创意工作者,但总体而言,人们正在使用AI。
主要使用场景
那么,考虑到这一点,用户希望从大语言模型中获得什么?
首先,研究人员发现(使用Clio),Claude.ai主要用于类似工作的任务,尤其是编程。大约10%的回答涉及"Web和移动应用程序开发",教育占7%;商业策略/运营接近6%。
至于回答中的职业分布,结果突出了这些类别:计算机和数学专业占37.2%;艺术和媒体占10.3%;教育和图书馆科学占9.3%;办公和行政占7.9%;生命科学占6.4%,商业和金融专业占5.9%。
在这种背景下,一些用户谈到了使用AI的"污名化"——这仍然是一个问题。销售人员和其他人发现,当收件人能够判断出他们使用AI发送消息时,反应可能非常负面。
"管理者同样基于自己的偏见做出决定——包括许多招聘选择,"Inc.com的Bruce Crumley在5月份写道,引用了杜克大学福卡商学院管理与组织研究。"许多(在研究中接受调查的)人认为使用AI的员工或候选人在某种程度上是懒惰的,或试图获得超越同事的优势。换句话说,不仅使用AI力量的工作者被看不起,而且在某些情况下,他们的努力会被边缘化。"
这是另一项相关研究,显示了更多的负面影响。
对Clio的反馈
一些研究Anthropic调查和Clio使用的人士表示,该工具似乎实现了研究人员所称的"半结构化数据收集"。
这意味着什么?
从某种意义上说,你可以将其描述为访谈方法(个人化和私人化)与调查(在受访者方面撒下广网)的结合。
但事实证明,半结构化数据收集是专业研究人员熟知的术语。
"半结构化访谈代表了结构化和非结构化方法之间的中间地带,"图书馆和信息管理学术博客的Harun ar Rashid写道。"这种方法涉及一套预先确定的开放式问题,允许访谈者灵活地探索额外主题或更深入地探讨特定回应。半结构化访谈在定性研究中备受重视,因为它们平衡了结构化访谈的一致性和非结构化访谈的深度,使其适用于广泛的研究。"
Q&A
Q1:Clio是什么?它有什么特殊功能?
A:Clio是Anthropic公司开发的一个全新调查工具,它能在保护用户隐私的同时深入挖掘用户群体的详细信息,帮助研究人们如何使用大语言模型以及他们对此的感受。
Q2:Claude.ai主要被用于哪些工作场景?
A:根据调查结果,Claude.ai主要用于工作相关任务,特别是编程。其中约10%的使用涉及Web和移动应用程序开发,7%用于教育,接近6%用于商业策略和运营。
Q3:使用AI工具在职场中会遇到什么问题?
A:调查发现使用AI仍存在"污名化"问题。一些管理者和同事认为使用AI的员工是懒惰的或试图获得不公平优势,这可能导致负面反应,甚至在招聘决策中受到歧视。
好文章,需要你的鼓励
Anthropic推出Claude Code的Slack集成功能,让开发者能直接在聊天线程中委托编程任务。这项测试功能于周一以研究预览版形式发布,基于现有Slack集成增加了完整工作流自动化。开发者现在可以标记@Claude启动完整编程会话,Claude会分析消息确定合适的代码库,在线程中发布进度更新并分享审查链接。这反映了行业趋势:AI编程助手正从IDE迁移到团队协作工具中。
波恩大学研究团队首次量化AI训练的材料成本,发现一块GPU含32种元素,93%为重金属。训练GPT-4需消耗约7吨金属材料,其中多为有毒重金属。研究建立了从计算需求到硬件消耗的评估框架,发现通过软硬件优化可减少93%的资源消耗。该研究揭示了AI发展的隐性环境代价,呼吁行业从规模竞赛转向效率革命,实现可持续发展。
AI发展推动数据中心行业迎来前所未有的挑战与机遇。Switch公司消耗内华达州三分之一电力,展现了AI对电力需求的巨大规模。核能成为AI未来发展的关键,单个AI机架功耗可达1.7MW。预计到2030年,数据中心行业将消耗200GW电力。创新的星形配置设计和差异化备电策略正在重新定义数据中心的弹性架构,仅20%的工作负载需要发电机备份。
南开大学团队构建了迄今最大规模的结肠镜AI数据库COLONVQA,包含110万视觉问答条目。他们发现现有AI模型存在泛化能力不足和容易被误导等问题,因此开发了首个具备临床推理能力的结肠镜AI模型COLONR1。该模型采用多专家辩论机制生成推理数据,在综合评估中准确率达56.61%,比传统方法提升25.22%,为智能结肠镜诊断从图像识别向临床推理的转变奠定了基础。