微软正在将其 Copilot Vision 功能从网页端扩展到 Windows 和移动设备平台。Copilot Vision 是微软去年 Copilot 重新设计中的重要组成部分,但迄今为止,它仅限于在 Edge 浏览器网页中帮助用户理解所看到的内容。
现在,Copilot Vision 将能够分析移动设备摄像头的实时视频,使这款 AI 助手能够为用户提供植物护理建议或家居装饰指导。微软今天在 iOS 和 Android 平台的 Copilot 应用中推出了 Copilot Vision 功能,同时这项功能也将很快登陆 Windows 平台。
Windows 版 Copilot 应用正在更新,以支持在整个 PC 系统中使用 Copilot Vision。这使得微软的 AI 助手能够指导用户使用 Adobe Photoshop 的功能,或分析用户正在查看的照片和网页。
这与微软在 Copilot Plus PC 上的 Recall 功能有所不同。Recall 功能在启用后会自动截取快照,而 Copilot Vision 更像是在 Microsoft Teams 通话中进行应用程序或整个桌面的屏幕共享。
Windows 版 Copilot Vision 将于下周向 Windows 预览体验成员开放,微软表示将在测试完成后进行更广泛的推广。同时,公司今天还为 Copilot 更新了一系列新功能。这款 AI 助手现在支持记忆功能、个性化设置、基于网络的操作、播客创建、深度研究等功能。您可以在这里了解有关 Copilot 的所有新功能。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。