有时候,看似不错的创意、知名风投的大额融资以及众多人脉广泛的天使投资人支持,仍然不足以保证成功。
联合创始人潘卡杰·古普塔和吉拉德·米什内于周二宣布,Yupp在推出不到一年后即将关闭业务。
Yupp提供的是众包式AI模型选择服务。它允许消费者免费测试和比较来自800个AI模型的结果,包括OpenAI、谷歌和Anthropic等公司的最先进模型。Yupp会根据用户的提示请求返回多个回复,包括信息或图像,用户则对哪些模型效果最佳以及原因提供反馈。
这个创意的核心是生成关于人们对AI实际需求的匿名数据,然后向模型制造商出售这些数据。Yupp表示已注册130万用户,每月收集数百万条用户偏好数据,甚至还设立了排行榜。该公司表示也有几家AI实验室作为客户。
然而,创始人表示,公司最终"未能达到足够强的产品市场契合度"来维持运营,部分原因是AI模型在过去几个月里改进幅度巨大。
虽然实验室愿意为反馈数据付出高价,但目前的主流模式——由Scale AI和Mercor等公司开创——是雇佣专业专家,如博士学位持有者,并将他们整合到强化学习循环中。
此外,硅谷已经在展望未来,届时AI将为其他AI构建并被其他AI使用。模型制造商现在可能需要一些消费者反馈,但他们主要在为智能体而非人类主导在线世界的那一天做准备。
Yupp首席执行官古普塔在X平台上发布关于关闭计划的帖子中写道:"仅在过去一年中,AI模型能力格局就发生了巨大变化,并将继续快速变化。未来不仅仅是模型,而是智能体系统。"
Yupp在2024年完成了由a16z crypto的克里斯·迪克森领投的3300万美元种子轮融资,这在当时算是巨额种子轮。此外,Yupp还获得了45多位天使投资人和小型投资者的投资。其中包括谷歌DeepMind首席科学家杰夫·迪恩、Twitter联合创始人比兹·斯通、Pinterest联合创始人埃文·夏普以及Perplexity首席执行官阿拉温德·斯里尼瓦斯等业界知名人士。
古普塔表示,Yupp的一些员工将加入一家"知名"AI公司,其他人则在寻找下一个工作机会。Yupp暂未回应TechCrunch的置评请求。
Q&A
Q1:Yupp是什么公司?它提供什么服务?
A:Yupp是一家AI模型众包评测平台,提供免费的AI模型测试和比较服务。用户可以在平台上测试来自800个AI模型的结果,包括OpenAI、谷歌和Anthropic等公司的先进模型,并对模型效果提供反馈。
Q2:Yupp为什么会关闭?
A:Yupp关闭主要因为未能达到足够强的产品市场契合度。AI模型在过去几个月改进幅度巨大,而且行业趋势转向智能体系统,模型制造商更倾向于雇佣专业专家提供反馈,而非依赖消费者众包数据。
Q3:Yupp获得了多少融资?投资方有哪些?
A:Yupp在2024年完成了3300万美元的种子轮融资,由a16z crypto的克里斯·迪克森领投。此外还获得了45多位天使投资人支持,包括谷歌DeepMind首席科学家杰夫·迪恩、Twitter联合创始人比兹·斯通等知名人士。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。