在经过为期四个月的有限预览后,Google 现已向更多用户开放其 Veo 2 视频生成模型。该公司已开始向 Gemini Advanced 用户推送这一工具,用户可以利用它生成最多八秒、分辨率为 720p 的视频片段。Google 对该模型解释道:“描述越详细,对最终视频的掌控越强。”
目前,Gemini 仅支持生成 16:9 横屏格式的视频,这意味着它不太适合制作社交媒体视频。话虽如此,Google 提到,通过 Gemini 的分享功能,你可以直接将视频上传至 TikTok 或 YouTube,而通过聊天机器人生成的所有视频都会自动以 MP4 格式保存。相较于之前的版本,Google 表示 Veo 2 对现实物理现象和人体运动的理解更为出色。
如果你想开始使用 Gemini 生成视频片段,则需要订阅 Google 每月 20 美元的 One AI Premium Plan。一旦公司完成 Veo 2 的全面推广,你将可以在网页版和移动端的 Gemini 上使用任何语言生成视频。
另外,Google 正在将 Veo 2 的生成功能引入 Whisk。对于不太了解该应用的用户,Whisk 是 Google Labs 测试平台上提供的一款实验性生成式 AI 应用。它不仅可以通过文本和图像提示生成图片,现在借助于整合了 Veo 2,你还能利用 Whisk 将应用中生成的内容进行动画化处理。
好文章,需要你的鼓励
随着5G流量快速增长和新用例不断涌现,网络运营商需要在最小化环境影响的同时管理密集网络使用。Orange法国与爱立信合作开展创新试验,测试FDD大规模MIMO天线集成无线电,优化高流量区域频谱使用。双方还探索Cloud RAN和Open RAN架构,通过虚拟化RAN功能实现灵活的软件中心网络。合作重点关注利用AI驱动的自动化和意图驱动技术提升能源效率,在不影响性能的前提下动态调整网络资源以降低能耗。
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
微软正在将Windows 11改造为"智能代理操作系统",在任务栏中集成AI代理功能。新功能允许AI代理在后台执行任务,用户可通过任务栏图标查看进度状态。微软还在文件资源管理器中集成Copilot,提供文档摘要、文件问答等功能。此外,Click to Do功能得到改进,可将网页表格转换为Excel文档。这些AI功能采用本地AI和云端AI混合模式,为用户提供更智能的操作体验。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。