根据微软研究院和卡内基梅隆大学研究人员的一项研究表明,一些知识工作者可能正在过度依赖生成式 AI,这可能导致他们的问题解决能力下降。
在题为《生成式 AI 对批判性思维的影响》的论文中,七位研究人员对 319 名每周至少使用一次生成式 AI 的知识工作者进行了调查和分析,研究他们在使用 Copilot 和 ChatGPT 等工具时是否运用批判性思维。
研究发现,对任务有信心的员工更可能对生成式 AI 的输出结果进行批判性思考,而对任务不太有把握的员工往往会认为生成式 AI 产生的答案已经足够,不会去思考 AI 提供的内容。
研究人员建议需要重新思考企业 AI 工具的设计。
论文指出:"对 AI 的信任与降低批判性思维努力相关,而自信则与增加批判性思维相关。这种二元性表明设计策略应该注重平衡这些方面。"
研究团队建议,AI 工具应该包含支持长期技能发展的机制,并鼓励用户在与 AI 生成的输出交互时进行反思性思考。
研究人员表示:"这与可解释 AI 的目标相一致",他们指的是让 AI 说明其如何得出输出结果的做法。这对 DeepSeek 和 OpenAI 最新的思维链 AI 模型来说是个好消息,但仅仅解释 AI 的推理过程是不够的。
研究人员写道,好的 AI 工具应该通过主动设计策略来培养批判性思维,鼓励用户反思并在必要时提供帮助。
论文得出结论,我们应该适应 AI 融入的世界,通过运用批判性思维来验证 AI 输出及其在日常工作中的应用。考虑到七位作者中有六位来自销售 Copilot 的公司,这个结论可能在意料之中。
研究人员承认,知识工作者应该被教导"保持信息收集和问题解决的基础技能,避免过度依赖 AI",但不要过度。那些使用 ChatGPT、Copilot 和其他生成式 AI 工具的人应该接受"信息验证、响应整合和任务管理技能"的培训。
论文将在 2025 年 4 月底举行的人机交互系统会议上展示。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。