英伟达研究人员开发出一款革命性的常开视觉系统,能够在不到一毫秒的时间内检测到人脸。该系统通过"竞速休眠"技术在视觉处理后节省功耗,为自动驾驶汽车、机器人和消费电子产品提供了新的可能。
超低功耗设计理念
传统的视觉处理系统通常需要约10瓦的功率,这对于持续开启的人脸检测系统来说功耗过高。英伟达的片上系统在60帧每秒的帧率下,功耗仅为5毫瓦。
英伟达电气工程师Ben Keller在旧金山举行的IEEE国际固态电路会议上介绍了这一系统。该系统每16.7毫秒刷新处理一张新图像,但仅在5%的时间内保持全功率运行。在787微秒内,片上系统调用深度学习加速器判断是否存在人脸,准确率约为99%。
Alpha-Vision常开低功耗加速器
英伟达团队精心设计了这一系统,以实现快速检测并节省功耗。片上系统的大部分组件默认处于断电状态,只有一个功耗低于10毫瓦的子系统保持开启状态。这个子系统被称为"常开低功耗加速器",即Alpha-Vision。
竞速休眠技术创新
人脸检测器使用深度神经网络识别人脸,这需要处理大量数据,可能造成功耗流失。为了节省功耗并加快检测速度,所有必要数据都存储在本地的大容量SRAM中,总计达到2兆字节。
SRAM占据了芯片的大量空间。为了防止SRAM漏电成为功耗的主要来源,片上系统集成了深度学习加速器和近内存处理器,能够快速关闭内存组。研究人员将这种方法称为"竞速休眠"。
广阔的应用前景
英伟达团队提出了该系统的几种可能用途。集成人脸传感器的笔记本电脑可以在用户离开时关闭显示屏以节省能源,当用户返回时再次开启,提供无缝体验,无需输入密码。
Keller表示,基于这些设计的系统还可能用于为自动驾驶汽车、无人机和机器人技术提供常开视觉功能。这一技术突破为未来的智能设备和自主系统开辟了新的可能性。
Q&A
Q1:英伟达的常开视觉系统有什么特别之处?
A:英伟达开发的常开视觉系统能在不到一毫秒内检测人脸,功耗仅为5毫瓦,比传统系统的10瓦功耗大幅降低。系统使用"竞速休眠"技术,仅在5%的时间内保持全功率运行,检测准确率达到99%。
Q2:什么是"竞速休眠"技术?
A:"竞速休眠"是英伟达团队开发的节能技术。系统将所有必要数据存储在2兆字节的本地SRAM中,通过集成深度学习加速器和近内存处理器,能够在完成检测后快速关闭内存组,防止SRAM漏电造成功耗浪费。
Q3:这种人脸检测芯片可以应用在哪些设备上?
A:该芯片可应用于多种设备:笔记本电脑可在用户离开时自动关闭屏幕节能,返回时无需密码即可开启;还可用于自动驾驶汽车、无人机和机器人,为这些设备提供常开视觉功能,实现更智能的环境感知。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。