据报道,Meta 正在为其智能眼镜产品系列开发一种他们称为 “超级感知” 的面部识别技术。 The Information 的最新报道指出,Meta 正在研发一款眼镜软件,该软件具有按姓名识别人脸并能更好地追踪用户一整天活动的功能。
公司原本计划在首代智能眼镜中集成类似技术,但由于隐私顾虑而放弃了这一尝试。
然而,现在该技术似乎重新被提上日程。据报道,Meta 正在研发两款新的智能眼镜 ( 内部代号为 Aperol 和 Bellini) ,同时重新评估与该技术相关的隐私政策及潜在安全风险。
该报道还提到,这一功能将仅供用户选择性启用。
这一举措是 Meta 扩大智能眼镜产品线并更深入将 AI 技术融入产品的一部分。此前有消息称,包括 Google ( 现在开发其首款自 Google Glass 后的智能眼镜) 在内的竞争对手正在加大对此领域的投入。
报道称,该公司还计划将同样的 “感知” 识别功能融入搭载 AI 的耳机中,这款耳机据说内置了摄像头和传感器。
Meta 的一位代表未能立即对此置评。
—— 理想的测试场 ——
市场情报公司 ABI 的研究总监 Eric Abbruzzese 表示,此举在一定程度上是 Meta 之前研发搭载 AI 的 Ray-Ban 眼镜的自然延伸。
他说:“这些设备基本上是一种简化包装,旨在以尽可能低的成本在眼镜这种产品形态中提供 AI 功能,因为从成本和设计角度来看,显示屏仍然是眼镜面临的最大挑战之一。”
他补充道:“虽然 Meta 未来计划推出具备显示屏的智能眼镜,但这类无显示屏设备作为专注于 AI 交互的独特产品类别,不仅为 AI 平台自身提供了理想的试验场,也为其在智能眼镜设备上的互动应用提供了绝佳实验平台。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。