就在中国人工智能开发商 DeepSeek Ltd. 推出低成本 ChatGPT 替代方案震惊世界几周后,另一家中国初创公司也引发了类似轰动,发布了据称是目前最先进的自主 AI 系统之一。
这个名为 Manus AI 的系统被称为是一个能够"连接思维和行动"的新一代 AI 系统,它不仅能处理信息,还能代表用户完成完整的任务。该系统由 Monica 公司开发,于 3 月 6 日推出,并迅速获得全球关注。其开发者表示,Manus 在 GAIA 基准测试中超越了 OpenAI 的 DeepResearch 模型。
与 ChatGPT、Grok 和 Google 的 Gemini 等需要人工输入才能执行任务的 AI 聊天机器人不同,Manus 能够渐进式地做出决策并独立完成各种任务。因此,它无需等待用户提供指令就能开始行动。
举例来说,如果用户要求"帮我找一套公寓",Manus 不仅会搜索各种房源信息,还会研究和评估犯罪率、天气和通勤时间等多个因素,从而提供更具针对性的建议。
Manus 并非使用单一模型,而是采用了多个专门负责不同领域的子代理,使其能够轻松执行复杂的多步骤工作流程。此外,它采用异步工作方式,在后台运行,仅在输出结果准备就绪时才通知用户。
媒体报道热议 Manus 是一个游戏规则改变者,代表着 AI 系统向完全独立运作方向的转变。这不仅带来令人兴奋的可能性,也加剧了对 AI 取代人类工作者以及承担过多责任的担忧。
Forbes 在一篇赞誉报道中称,Manus 将"改变一切",打破了美国在 AI 开发领域无可争议领导者的观念。报道指出,Manus 证明中国不仅已经赶上美国,还可能在开发完全自主 AI 代理的竞赛中超越了其竞争对手。
Manus 确实具有一些有趣的实际应用。例如,它能够自主分析简历、交叉参考就业市场趋势,并从求职者池中筛选出最合适的候选人,同时为每个人提供详细报告。
Manus 还可用于软件开发,能够快速从零开始生成网站。一旦确定设计方案,它甚至可以自行部署网站,解决托管等技术问题。
这些能力表明 Manus 可能对人类工作者构成真正的威胁,因为它有能力实际取代某些职位,而不仅仅是提高工作效率。这反过来又引发了伦理问题和监管担忧。
然而,Manus 可能并不如宣传的那么厉害。目前,这个 AI 代理仅向特定的测试者开放,需要邀请才能使用。
Manus 的创建者表示,他们仍在努力扩展系统规模并解决用户报告的问题。但多份报告显示,他们可能面临不少挑战。测试用户反映出现大量错误信息和无限循环,在事实性问题上出现错误,未能引用结果来源,甚至出现一些基础性错误。
TechCrunch 的 Kyle Wiggers 在早期访问中也报告了多个 Manus 未能完成看似简单任务的情况,如订购三明治、预订酒店房间或开发火影忍者风格的格斗游戏。
尽管如此,仍有许多人对 Manus 印象深刻。毫无疑问,它在周末席卷了互联网,到处都能看到用户惊叹的报告。
虽然仍需观察创建者是否能解决初期问题,但 Manus 的出现无疑将进一步挑战硅谷领先科技公司在 AI 竞赛中独占鳌头的假设。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。