微软 Bing 在周一宣布,其应用程序现推出 Bing 视频创作工具,该工具采用了 OpenAI 的 Sora 模型,支持用户依据文本提示生成视频。
与微软有长期合作关系的 OpenAI 已将 Sora 的视频生成功能仅限于付费客户使用,而其在微软 Bing 中的集成则标志着该功能首次免费提供。
在发布初期,Bing 视频创作工具尚未在桌面端推出,而且生成视频可能需要数小时,即使在使用所谓的 "fast" 模式(仅需几分钟)情况下也是如此。
只要用户登录微软账户,便可通过 Bing 应用免费制作 10 个视频剪辑。此后,每个视频均需支付 100 微软 Rewards 积分。这些积分可通过 Bing 搜索或在 Microsoft Store 购物获得——例如,每次 PC 端使用 Bing 搜索可获得 5 积分,单日上限为 150 积分。
用户一次最多可排队 3 个 5 秒的视频生成作业——目前无法更改视频长度。迄今为止,视频仅支持以竖直 9:16 的宽高比生成,这或许是为了鼓励用户在 TikTok 或 Instagram 上分享他们的 AI 创作。但很快,横屏 9:16 的上传选项也将面世。
好文章,需要你的鼓励
香港大学联合多家顶尖机构开发出推测性雅可比降噪解码技术,巧妙融合扩散模型降噪与自回归并行处理,将AI图像生成速度提升2-5倍。该方法通过训练模型处理噪声输入并预测干净标记,实现多位置同时生成,在保持图像质量的同时大幅缩短等待时间,为AI创作应用带来革命性改善。
谷歌推出类似苹果私有云计算的新平台,让用户在享受先进AI功能的同时保护数据隐私。该平台将复杂AI请求转移到云端处理,确保敏感数据仅用户可见,连谷歌也无法访问。随着AI工具需要更强计算能力,这一方案平衡了隐私保护与性能需求。Pixel 10手机将获得更智能的Magic Cue建议和更多语言的录音转录功能。
韩国大学等机构研究团队提出TAG方法,解决AI绘画中的"幻觉"问题。该方法通过放大扩散过程中的切线分量来引导AI生成更真实图像,无需重训练模型且计算成本极低。实验显示TAG能显著改善图像质量,减少不合理细节如多指手等,同时可与现有引导技术结合使用,为AI绘画领域提供了简单有效的优化方案。