你下一次玩精灵宝可梦 GO 时可能会发现一些变化。这款游戏即将迎来新的公司掌舵者。与此同时,前母公司 Niantic 另有规划:未来将减少在游戏方面的投入,转而专注于利用这些游戏数据来生成 AI 地图。我已经看到了这个未来的一些雏形,而 AR 眼镜可能只是这一宏大蓝图中的一个组成部分。
不过,游戏仍然会继续存在。Niantic 保留了 Ingress 和 Peridot 这两款最注重增强现实、位置和地图连接的游戏的控制权。这些游戏,加上 Niantic 进一步转型为 Niantic Spatial,可能预示着未来的发展方向:科技公司开始探索如何让 AI 理解我们周围的世界,而不是重复 Meta Ray-Bans 等 AI 眼镜失败的尝试。
Niantic 对此消息没有额外评论。不过,我最近体验了专为 Quest 开发的 Scaniverse 应用 (该应用于 2021 年被收购)。这款应用主要用于发现真实世界位置的现有 3D 扫描,类似于 Polycam 等其他 3D 扫描应用,Scaniverse 专注于创建和查看位置数据。但是,Niantic 未来的计划可能更侧重于利用精灵宝可梦 GO 玩家长期积累的这些数据来训练 AI。如果要让 AR 和常开型可穿戴 AI 真正发挥作用,我们需要更好地掌控数据共享的方式和时机。
从 Niantic 的角度来看,下一步将聚焦于将这些扫描地图作为 AI 的数据来源。
Niantic CEO John Hanke 在 LinkedIn 发文表示:"我们正处于技术的剧变期,AI 正在快速发展。现有的地图是为人类阅读和导航而建造的,但现在我们需要一种新型地图,让机器能够理解世界,从智能眼镜到人形机器人,都能理解和导航物理世界。当今的大语言模型是朝着这个未来迈出的第一步,在这个未来中,各种专家模型将协作解决复杂问题,而这些问题中的许多都需要对物理世界有深入准确的认知。Niantic 正在构建能帮助 AI 突破屏幕限制、走入现实世界的模型。"
Niantic 已经开始专注于为手机和 Meta Quest 等头显设备的 AR 和 VR 体验扫描现实世界,主要是为了展示当你再次步入这些逼真的 3D 扫描时有多么有趣。像 Polycam 这样的公司 (我在 Vision Pro 上也体验过他们令人印象深刻的真实环境 3D 扫描) 已经在探索将这些扫描用于更多商业目的。Niantic 对他们的扫描技术也提出了相同的主张。这些扫描背后的技术被称为高斯散射,是通过多张照片和深度感知数据生成的。
AI 通过研究这些高级扫描来理解和导航现实世界的想法是一个全新的层次,但这并不令人意外。AR 和 VR 已经成为 AI 和机器人技术的训练场,而我们通过佩戴智能眼镜和其他世界映射可穿戴设备收集的数据集,必然会成为生成式 AI 下一步研究的对象。这很可能会成为 Meta、Google,最终也包括 Apple 等公司的重要基础,用于让现实世界中的 AR 眼镜真正发挥作用,并通过 AI 识别周围的事物。
Meta 和 Google 等公司已经在使用配备传感器的智能眼镜原型来探索构建具有 AI 实时世界感知辅助系统。Project Aria 和 Project Astra 是未来具有持续感知能力的智能眼镜的基础,但它们仍然缺乏对世界更深入的、有帮助的认知。利用 3D 扫描地图数据进行训练可能是下一个飞跃的重要组成部分,这最终将应用于 Meta 的 Orion AR 眼镜原型和 Google 的 Android XR 设备等产品中。
Niantic 并不是唯一一家专注于将现实世界扫描到未来地图中的公司:Google、Apple、Snap 以及包括 Polycam 在内的许多其他公司都在这么做。Niantic 目前的定位似乎更倾向于 AI,但 AI 和 AR 似乎注定要融合。我仍然不理解各家公司收集的地图数据和个人数据是如何被清晰区分的。而当 Niantic 从游戏转向专注于 AR 的未来时,这既引发了好奇,也带来了担忧。
好文章,需要你的鼓励
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。