微软正在将其 Copilot Vision 功能从网页端扩展到 Windows 和移动设备平台。Copilot Vision 是微软去年 Copilot 重新设计中的重要组成部分,但迄今为止,它仅限于在 Edge 浏览器网页中帮助用户理解所看到的内容。
现在,Copilot Vision 将能够分析移动设备摄像头的实时视频,使这款 AI 助手能够为用户提供植物护理建议或家居装饰指导。微软今天在 iOS 和 Android 平台的 Copilot 应用中推出了 Copilot Vision 功能,同时这项功能也将很快登陆 Windows 平台。
Windows 版 Copilot 应用正在更新,以支持在整个 PC 系统中使用 Copilot Vision。这使得微软的 AI 助手能够指导用户使用 Adobe Photoshop 的功能,或分析用户正在查看的照片和网页。
这与微软在 Copilot Plus PC 上的 Recall 功能有所不同。Recall 功能在启用后会自动截取快照,而 Copilot Vision 更像是在 Microsoft Teams 通话中进行应用程序或整个桌面的屏幕共享。
Windows 版 Copilot Vision 将于下周向 Windows 预览体验成员开放,微软表示将在测试完成后进行更广泛的推广。同时,公司今天还为 Copilot 更新了一系列新功能。这款 AI 助手现在支持记忆功能、个性化设置、基于网络的操作、播客创建、深度研究等功能。您可以在这里了解有关 Copilot 的所有新功能。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。