微软 Bing 在周一宣布,其应用程序现推出 Bing 视频创作工具,该工具采用了 OpenAI 的 Sora 模型,支持用户依据文本提示生成视频。
与微软有长期合作关系的 OpenAI 已将 Sora 的视频生成功能仅限于付费客户使用,而其在微软 Bing 中的集成则标志着该功能首次免费提供。
在发布初期,Bing 视频创作工具尚未在桌面端推出,而且生成视频可能需要数小时,即使在使用所谓的 "fast" 模式(仅需几分钟)情况下也是如此。
只要用户登录微软账户,便可通过 Bing 应用免费制作 10 个视频剪辑。此后,每个视频均需支付 100 微软 Rewards 积分。这些积分可通过 Bing 搜索或在 Microsoft Store 购物获得——例如,每次 PC 端使用 Bing 搜索可获得 5 积分,单日上限为 150 积分。
用户一次最多可排队 3 个 5 秒的视频生成作业——目前无法更改视频长度。迄今为止,视频仅支持以竖直 9:16 的宽高比生成,这或许是为了鼓励用户在 TikTok 或 Instagram 上分享他们的 AI 创作。但很快,横屏 9:16 的上传选项也将面世。
好文章,需要你的鼓励
本文评测了六款控制台平铺终端复用器工具。GNU Screen作为老牌工具功能强大但操作复杂,Tmux更现代化但学习曲线陡峭,Byobu为前两者提供友好界面,Zellij用Rust编写界面简洁易用,DVTM追求极简主义,Twin提供类似TurboVision的文本界面环境。每款工具都有各自特点和适用场景。
韩国汉阳大学联合高通AI研究院开发出InfiniPot-V框架,解决了移动设备处理长视频时的内存限制问题。该技术通过时间冗余消除和语义重要性保留两种策略,将存储需求压缩至原来的12%,同时保持高准确性,让手机和AR眼镜也能实时理解超长视频内容。
网络安全公司Snyk宣布收购瑞士人工智能安全研究公司Invariant Labs,收购金额未公开。Invariant Labs从苏黎世联邦理工学院分拆成立,专注于帮助开发者构建安全可靠的AI代理工具和框架。该公司提供Explorer运行时观察仪表板、Gateway轻量级代理、Guardrails策略引擎等产品,并在工具中毒和模型上下文协议漏洞等新兴AI威胁防护方面处于领先地位。此次收购将推进Snyk保护下一代AI原生应用的使命。
纽约大学研究团队通过INT-ACT测试套件全面评估了当前先进的视觉-语言-动作机器人模型,发现了一个普遍存在的"意图-行动差距"问题:机器人能够正确理解任务和识别物体,但在实际动作执行时频频失败。研究还揭示了端到端训练会损害原有语言理解能力,以及多模态挑战下的推理脆弱性,为未来机器人技术发展提供了重要指导。