Google Photos现在正式向用户免费开放Veo 3视频生成功能,用户可以直接在相册中为静态照片添加动画效果。
这项新功能基于Google最新的Veo 3生成式AI模型,能够将用户相册中的静态图片转换为动态视频。用户只需在Google Photos中选择想要处理的照片,然后使用Veo 3功能即可自动生成流畅的动画效果。
Veo 3作为Google在生成式AI领域的最新成果,具备强大的图像理解和视频生成能力。它能够智能分析照片中的元素,包括人物、物体、背景等,然后生成自然的动作和过渡效果,让静态照片"活"起来。
这一功能的推出标志着生成式AI技术在消费级应用中的进一步普及。用户无需任何专业的视频编辑技能,就能轻松创建具有电影感的动态内容。Google表示,这项功能完全免费提供给所有Google Photos用户使用。
目前该功能已经开始向全球用户逐步推送,用户可以通过更新Google Photos应用来体验这一新功能。Google计划在未来继续优化Veo 3的性能,为用户提供更多创意工具。
Q&A
Q1:Google Photos的Veo 3功能是什么?
A:Veo 3是Google Photos新推出的免费功能,基于Google最新的生成式AI模型,能够将用户相册中的静态照片转换为动态视频,让照片"活"起来。
Q2:如何使用Google Photos的Veo 3动画功能?
A:用户只需在Google Photos中选择想要处理的静态照片,然后使用Veo 3功能即可自动生成流畅的动画效果,无需任何专业的视频编辑技能。
Q3:Veo 3功能需要付费吗?
A:不需要,Google表示这项功能完全免费提供给所有Google Photos用户使用,用户只需更新应用即可体验。
好文章,需要你的鼓励
微软与Anthropic达成合作协议,为Microsoft 365 Copilot用户提供Claude AI引擎选项。商业版Frontier Copilot用户可选择Claude Opus 4.1和Sonnet 4等模型,但需管理员权限。这标志着微软正在超越OpenAI,采用更开放的AI代理方式。微软已在Visual Studio中集成Claude,并在Azure中加入Grok AI。微软AI CEO表示,公司将基于他人最佳技术构建应用,而非追求AI领导地位。
哥本哈根大学等机构研究发现,主流视觉语言模型在将图像转换为文字描述时会丢失40%-90%的视觉信息。研究开发了两种创新方法来量化这种信息丢失:邻居关系分析和嵌入重建技术。实验表明信息丢失直接影响AI的检索和问答性能,研究还实现了丢失区域的精确可视化,为优化AI视觉系统提供了重要工具。
OpenAI发布ChatGPT脉冲功能,这一推送特性可根据用户聊天历史自动生成个性化每日更新。该功能目前向Pro订阅用户开放,通过分析用户聊天记录、偏好设置以及Gmail和谷歌日历连接,AI模型在夜间进行研究,次日清晨以卡片形式推送相关信息。用户可通过点赞或踩的方式提供反馈。这标志着OpenAI向主动式AI助手转变的重要一步。
阿联酋研究团队创建了PersonaX数据库,包含超过1.3万人的多模态性格分析数据。通过整合面部照片、背景信息和AI生成的行为特征描述,研究首次实现了大规模的跨模态性格分析。团队开发的双层分析框架不仅能发现统计关联,还能揭示深层因果关系,为理解人类性格特征提供了全新视角。