在日常生活中,你可能会解锁或查看手机数十次,这使得手机锁屏成为广告主的热门广告位。广告科技公司 Glance 多年来一直利用其充满广告的锁屏体验进行商业变现,而在 AI 时代,它正迈出更进一步的步伐。三星与 Glance 联手推出了一项全新的 “AI 购物” 体验,通过自拍创建个性化时尚广告。此功能将在未来一个月内在多款三星手机上陆续推送。
Glance 已存在一段时间——其非 AI 锁屏体验曾与三星、Motorola 等多个品牌的手机捆绑销售。在 AI 时代之前,Glance 以美图和新闻提醒吸引用户,而这些服务都伴随着广告和数据追踪。新推出的 Glance AI 功能不仅保留了这些内容,还为体验增添了一层令人不安的“盗脸”属性。
融入 AI 技术的 Glance 将以独立应用程序以及完全集成在锁屏中的形式出现在三星手机上。幸运的是,这是一项完全自愿参与的体验。如果你从未打开或设置 Glance,你仍然可以继续使用手机的常规锁屏。
如果你选择涉足这一充满未知的 AI 购物领域,Glance 会要求你拍摄自拍照并提供一些基本的体型信息。之后,它将利用 Google Gemini 和 Imagen 为你量身定制时尚广告——因为那些图像就是你。你的锁屏将呈现出你“身着你从未想象过的服装、置身于你从未想象过的目的地”的图像。当然,你只需轻触一下就能购买为你挑选的造型,这也为 Glance 带来丰厚收益。
我们已查阅了 Glance 的 AI 隐私政策,其中并无什么明显不同于科技行业常见的做法 ( which still isn't good )。使用该服务即表示你同意进行一定程度的跟踪,包括你的大致位置,并且部分数据将与合作伙伴共享。然而,当一项服务不断生成你的 AI 图像时,这一切就显得更加诡异。Glance 表示,它将保留用于创建你的数字头像的生物识别数据,自你上次使用该服务起保留 12 个月,或者直到你手动删除账户为止。该公司宣称,你的图像不会被用于其他任何目的,也不会在未经你同意的情况下与第三方共享。
Glance 并不是唯一一家希望通过定制 AI 图像来激发消费者购买欲望的公司。在上个月举办的 Google I/O 会议上,该公司在其 AI Mode 搜索产品中推出了购物功能。虚拟试穿功能允许你按需生成自己的 AI 图像,以便了解你在购物结果中显示的商品中的样子。而 Glance 的 AI 体验显得更为令人担忧,因为它会不断生成你身穿服饰的新图像,而这些图像可能基于 “流行趋势、当地事件和社交媒体热点” 而来。
如果你完全支持这种购物体验,或只是出于病态好奇,你可以在 Play Store 上下载独立的 Glance AI 应用程序来试用该服务。在三星手机上,该应用及锁屏功能将通过公司的 Galaxy Store 推出。从今天起,Galaxy S22、S23、S24 以及 S25 系列的所有手机将开始推送这一功能。Glance 表示,它希望在 30 天内在更多型号的三星手机上全面推广其 AI 购物服务。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。