AI实验室现在正在尝试一种新策略:不再与企业签署昂贵的数据合同,而是利用这些企业的前高级员工获取行业知识。Mercor CEO Brendan Foody在2025年TechCrunch Disrupt大会上表示,他们的平台正成为连接投资银行、咨询公司和律师事务所前员工与AI实验室的主要渠道,这些实验室希望实现这些行业的自动化。
Foody在台上解释说:"有观点认为高盛并不喜欢能够自动化其价值链的模型。这确实会改变竞争格局,这也是实验室需要我们的部分原因。他们的客户不愿意提供数据来自动化其价值链的大部分内容,因此他们需要雇佣曾在这些公司工作、了解这些工作流程并愿意训练模型来自动化它们的承包商。"
22岁的Mercor联合创始人Foody表示,他的初创公司向行业专家支付每小时高达200美元的费用,让他们填写表格和撰写报告用于AI训练。该公司现在拥有数万名承包商,据称每天向他们支付超过150万美元。尽管如此,Foody表示该初创公司仍然盈利,因为AI实验室愿意为这些有价值的数据支付更多费用。
自成立不到三年以来,Mercor的年度经常性收入已增长至约5亿美元,最近以100亿美元的估值完成融资。该公司的客户包括OpenAI、Anthropic和Meta。
各行业的现有企业有充分理由抵制Mercor的崛起,因为他们的行业知识可能通过在该初创公司平台上的前员工泄露,最终可能被用来自动化他们的工作。Foody承认他可能暴露了市场中的低效率,但表示他不会称其为"漏洞"。
事实上,Foody表示一些公司已经在拥抱这种"工作的新未来"。他提出Mercor的平台可能创造一种新型零工经济,就像十多年前Uber所做的那样。
虽然Mercor试图从各个行业提取知识,但Foody表示他的初创公司努力防止承包商进行企业间谍活动——即窃取专有信息、商业秘密或知识产权并将其出售给另一家企业的非法行为。
但这说起来容易做起来难。Mercor的大部分员工都是律师事务所、投资银行和其他对数据非常保密的行业的前员工。Foody表示,Mercor的一些承包商仍在其日常工作中工作,只是在业余时间提交数据,他声称承包商被指示不要上传来自其前工作场所的文档。尽管如此,考虑到其初创公司的规模,他承认"可能会发生一些事情"。
Foody认为员工头脑中的知识属于员工,而不是他们的公司——这比许多企业所持的观点更为宽松。此外,在Mercor的一些职位发布中,该初创公司在要求员工知识和公司数据之间踩线。
例如,Mercor目前正在寻找能够"授权访问大量生产代码库"用于AI评估或潜在AI模型训练的初创公司CTO或联合创始人。在一封电子邮件中,Mercor告诉TechCrunch有几位初创公司CTO接受了这一提议,但拒绝透露其合同的详细信息。
Mercor是最早招募美国高技能知识工作者并支付大笔费用来训练AI模型的数据初创公司之一。在AI繁荣初期,像Scale AI这样的数据供应商雇佣第三世界国家的承包商来完成相当简单的标记工作。现在,Mercor的大多数竞争对手——包括Surge和Scale AI——都已经意识到AI实验室需要专家来改进其AI模型。许多数据供应商也开始训练"环境"以提高智能体完成现实世界任务的能力。
Mercor明显受益于Scale AI的不幸:在Meta对该初创公司进行大笔投资并聘请其CEO后,许多AI实验室停止与Scale AI合作。在过去一年中,Mercor的估值增长了五倍,但它仍然比Surge和Scale AI小,后两者的估值都超过200亿美元。
目前,Mercor的大部分收入来自少数几个AI实验室,但Foody表示该初创公司计划未来与其他行业合作。他相信法律、金融和医学领域的公司将希望获得帮助,利用其数据来训练智能体——这是Mercor的专长。
Foody表示:"随着时间的推移,ChatGPT将比最好的咨询公司、最好的投资银行和最好的律师事务所都要好。这将从根本上改变经济,这将是一个广泛的积极力量,有助于为每个人创造丰富。"
Q&A
Q1:Mercor是什么?它主要做什么业务?
A:Mercor是一个连接AI实验室与行业专家的平台。它招募投资银行、咨询公司、律师事务所等企业的前员工,让他们利用自己的行业知识为AI模型训练提供数据,报酬最高可达每小时200美元。
Q2:为什么AI实验室需要通过Mercor获取数据?
A:因为许多企业不愿意直接与AI实验室分享数据来自动化自己的价值链,这会改变竞争格局。所以AI实验室需要雇佣了解这些工作流程的前员工来获取训练数据。
Q3:Mercor如何防止企业间谍活动?
A:Mercor指示承包商不要上传来自前工作场所的文档,并试图防止承包商窃取专有信息。但Foody承认由于公司规模庞大,仍可能发生一些问题。他认为员工头脑中的知识属于员工本人。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。