就在中国人工智能开发商 DeepSeek Ltd. 推出低成本 ChatGPT 替代方案震惊世界几周后,另一家中国初创公司也引发了类似轰动,发布了据称是目前最先进的自主 AI 系统之一。
这个名为 Manus AI 的系统被称为是一个能够"连接思维和行动"的新一代 AI 系统,它不仅能处理信息,还能代表用户完成完整的任务。该系统由 Monica 公司开发,于 3 月 6 日推出,并迅速获得全球关注。其开发者表示,Manus 在 GAIA 基准测试中超越了 OpenAI 的 DeepResearch 模型。
与 ChatGPT、Grok 和 Google 的 Gemini 等需要人工输入才能执行任务的 AI 聊天机器人不同,Manus 能够渐进式地做出决策并独立完成各种任务。因此,它无需等待用户提供指令就能开始行动。
举例来说,如果用户要求"帮我找一套公寓",Manus 不仅会搜索各种房源信息,还会研究和评估犯罪率、天气和通勤时间等多个因素,从而提供更具针对性的建议。
Manus 并非使用单一模型,而是采用了多个专门负责不同领域的子代理,使其能够轻松执行复杂的多步骤工作流程。此外,它采用异步工作方式,在后台运行,仅在输出结果准备就绪时才通知用户。
媒体报道热议 Manus 是一个游戏规则改变者,代表着 AI 系统向完全独立运作方向的转变。这不仅带来令人兴奋的可能性,也加剧了对 AI 取代人类工作者以及承担过多责任的担忧。
Forbes 在一篇赞誉报道中称,Manus 将"改变一切",打破了美国在 AI 开发领域无可争议领导者的观念。报道指出,Manus 证明中国不仅已经赶上美国,还可能在开发完全自主 AI 代理的竞赛中超越了其竞争对手。
Manus 确实具有一些有趣的实际应用。例如,它能够自主分析简历、交叉参考就业市场趋势,并从求职者池中筛选出最合适的候选人,同时为每个人提供详细报告。
Manus 还可用于软件开发,能够快速从零开始生成网站。一旦确定设计方案,它甚至可以自行部署网站,解决托管等技术问题。
这些能力表明 Manus 可能对人类工作者构成真正的威胁,因为它有能力实际取代某些职位,而不仅仅是提高工作效率。这反过来又引发了伦理问题和监管担忧。
然而,Manus 可能并不如宣传的那么厉害。目前,这个 AI 代理仅向特定的测试者开放,需要邀请才能使用。
Manus 的创建者表示,他们仍在努力扩展系统规模并解决用户报告的问题。但多份报告显示,他们可能面临不少挑战。测试用户反映出现大量错误信息和无限循环,在事实性问题上出现错误,未能引用结果来源,甚至出现一些基础性错误。
TechCrunch 的 Kyle Wiggers 在早期访问中也报告了多个 Manus 未能完成看似简单任务的情况,如订购三明治、预订酒店房间或开发火影忍者风格的格斗游戏。
尽管如此,仍有许多人对 Manus 印象深刻。毫无疑问,它在周末席卷了互联网,到处都能看到用户惊叹的报告。
虽然仍需观察创建者是否能解决初期问题,但 Manus 的出现无疑将进一步挑战硅谷领先科技公司在 AI 竞赛中独占鳌头的假设。
好文章,需要你的鼓励
本文揭示了AI时代CIO的七项关键行为特征,基于对多位CIO和AI专家的深度访谈。专家指出,AI精通的CIO需具备实用AI素养、战略视野和变革领导力,能将技术与业务战略对齐,建立强大数据治理基础。文章详细解析了分析型AI、生成式AI和智能体AI三大技术领域,强调数据基础的重要性,并提出CIO应从项目思维转向产品思维,通过跨职能团队实现端到端价值交付。
斯坦福大学等机构联合开发的CIFT系统首次解决了机器人"近视眼"问题,通过精确控制真实数据和合成数据的混合比例,让机器人在陌生环境中的表现提升54%以上。该系统包含多视角视频增强引擎MVAug和数据组合优化策略,能够预测数据失效的"去相干点",确保机器人学习真正重要的任务特征而非环境表象,为实用化通用机器人奠定了重要基础。
尽管苹果在AI竞赛中看似落后,但其私有云计算基础设施展现了技术优势。当行业为追赶大语言模型而降低隐私标准时,苹果坚持原则,开发出保护用户数据隐私的技术方案。谷歌最新宣布的类似实施方案验证了苹果技术路线的正确性,这可能推动其他AI实验室采用相同做法,为用户隐私带来重大胜利。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。