据路透社报道,Meta将开始追踪其美国员工的鼠标移动、点击及键盘输入行为,以此为未来的AI智能体生成高质量训练数据。
路透社援引Meta超级智能实验室团队发布的内部备忘录,报道了这项名为"模型能力计划"的员工追踪软件。据备忘录显示,该软件将在特定的工作相关应用和网站上运行,并定期截图以为AI训练提供上下文背景。
备忘录中写道:"这是所有Meta员工仅凭日常工作就能帮助模型持续进步的机会。"
Meta发言人安迪·斯通向路透社表示,所收集的训练数据将有助于Meta AI智能体处理一些目前尚存在困难的任务,包括"鼠标移动、点击按钮以及操作下拉菜单等操作"。
"如果我们要构建能帮助用户在电脑上完成日常任务的智能体,我们的模型就需要真实的人机交互案例,"斯通说,并补充表示,所收集的数据不会用于员工绩效评估。
虽然Meta美国员工的操作行为将被新软件追踪,但对欧洲员工进行类似监控则可能违反多项限制雇主追踪员工行为的当地法律。此前,Meta已因要求用户主动退出而非主动同意将其社交媒体内容用于AI训练,在欧盟面临潜在法律风险。
AI训练数据的多元探索
互联网包含了海量的文字、图像和视频,可用于训练生成式AI模型(尽管存在一些重要且颇具争议的法律限制)。然而,针对实体动作或虚拟计算机交互行为获取高质量训练数据的难度要大得多。部分公司已尝试采用复杂的物理仿真和精密手部追踪辅助设备,来创建AI机器人模型可理解的人机交互数据。
Meta此举正值OpenAI、Anthropic、谷歌和Perplexity等各大科技公司近期相继推出新工具,允许AI智能体接管用户的电脑或浏览器以完成特定任务之际。Ars Technica对部分消费级产品的初步测试显示,这些工具能够较为出色地将自然语言指令转化为虚拟操作,但在处理长期自动化任务时仍存在一定的局限性和不稳定性。
此外,据报道Meta已开始为部分员工(包括程序员和工程师)设定AI使用目标,同时据悉该公司还计划于今年5月启动全球裁员,规模可能高达员工总数的10%。
Q&A
Q1:Meta的"模型能力计划"具体会追踪员工哪些行为?
A:根据Meta内部备忘录,"模型能力计划"软件将追踪员工的鼠标移动、点击操作及键盘输入行为,同时在特定工作相关应用和网站上运行,并通过定期截图提供上下文背景信息,以此生成用于训练AI智能体的高质量数据。
Q2:Meta收集的员工操作数据会用于绩效考核吗?
A:不会。Meta发言人安迪·斯通明确表示,所收集的数据仅用于AI模型训练,帮助AI智能体学习如何完成鼠标移动、按钮点击及下拉菜单操作等日常电脑任务,不会被用于评估员工的工作表现。
Q3:Meta为何不对欧洲员工实施同样的追踪措施?
A:对欧洲员工进行类似监控可能违反多项欧洲国家法律,这些法律对雇主追踪员工行为有严格限制。此前Meta已因强制要求用户主动退出将社交媒体内容用于AI训练,而非让用户主动选择同意,在欧盟遭遇潜在法律问题。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。