在经过为期四个月的有限预览后,Google 现已向更多用户开放其 Veo 2 视频生成模型。该公司已开始向 Gemini Advanced 用户推送这一工具,用户可以利用它生成最多八秒、分辨率为 720p 的视频片段。Google 对该模型解释道:“描述越详细,对最终视频的掌控越强。”
目前,Gemini 仅支持生成 16:9 横屏格式的视频,这意味着它不太适合制作社交媒体视频。话虽如此,Google 提到,通过 Gemini 的分享功能,你可以直接将视频上传至 TikTok 或 YouTube,而通过聊天机器人生成的所有视频都会自动以 MP4 格式保存。相较于之前的版本,Google 表示 Veo 2 对现实物理现象和人体运动的理解更为出色。
如果你想开始使用 Gemini 生成视频片段,则需要订阅 Google 每月 20 美元的 One AI Premium Plan。一旦公司完成 Veo 2 的全面推广,你将可以在网页版和移动端的 Gemini 上使用任何语言生成视频。
另外,Google 正在将 Veo 2 的生成功能引入 Whisk。对于不太了解该应用的用户,Whisk 是 Google Labs 测试平台上提供的一款实验性生成式 AI 应用。它不仅可以通过文本和图像提示生成图片,现在借助于整合了 Veo 2,你还能利用 Whisk 将应用中生成的内容进行动画化处理。
好文章,需要你的鼓励
LibreOffice 25.8版本以"更智能、更快速、更可靠"为特色正式发布。新版本在多个方面实现性能优化,包括启动速度、文档滚动和文件打开速度的显著提升。该版本增强了对微软Office文档格式的兼容性,改进了连字符处理和字体兼容性,Calc表格组件新增十多个函数以更好支持Excel文件导入。值得注意的是,LibreOffice 25.8首次支持PDF 2.0格式导出,并具备PDF数字加密和签名功能。新版本提高了系统要求,不再支持Windows 7/8系列和32位系统。
谷歌DeepMind团队开发出ViNT视觉导航系统,让机器人像人类一样仅通过"看"就能在陌生环境中导航。该系统模仿ChatGPT的学习方式,通过分析600万个导航轨迹掌握通用导航能力,在未知环境中的成功率达87%。这一突破将推动物流配送、家庭服务、搜救等领域的机器人应用发展。
微软AI首席执行官苏莱曼发文称,研究AI福利和意识"既不成熟又危险",认为这会加剧人类对AI的不健康依赖。而Anthropic、OpenAI等公司正积极研究AI意识问题,招聘相关研究人员。业界对AI是否会产生主观体验及其权利问题分歧严重。前OpenAI员工认为可以同时关注多个问题,善待AI模型成本低且有益。随着AI系统改进,关于AI权利和意识的辩论预计将升温。
谷歌DeepMind推出AlphaFold3,革命性提升分子结构预测能力。该AI模型采用创新扩散网络架构,能够精确预测蛋白质与DNA、RNA、药物等分子的相互作用,准确率比传统方法提高50%以上。这一突破将显著加速新药开发,推动基础科学研究,并通过免费开放服务促进全球科研合作,标志着生命科学研究进入AI驱动的新时代。