Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

Google DeepMind CEO Demis Hassabis透露，Google计划将Gemini AI模型与Veo视频生成模型结合，以增强AI对物理世界的理解。这一举措旨在创建多模态的"通用数字助手"，能在现实世界中为用户提供帮助。AI行业正逐步发展towards全能模型，能够理解和生成多种媒体形式。

在最近一期由 LinkedIn 联合创始人 Reid Hoffman 共同主持的 Possible 播客节目中，Google DeepMind 的 CEO Demis Hassabis 表示，Google 计划将其 Gemini AI 模型与 Veo 视频生成模型最终整合在一起，以提升前者对物理世界的理解能力。

Hassabis 说道："我们从一开始就将 Gemini（我们的基础模型）设计为多模态的。我们这样做是因为我们对通用数字助手有一个愿景，这个助手能够在现实世界中真正帮助到你。"

AI 行业正在逐步向"全能"模型发展——这类模型能够理解和合成多种形式的媒体内容。Google 最新的 Gemini 模型可以生成音频、图像和文本，而 OpenAI 在 ChatGPT 中的默认模型也能原生创建图像——当然也包括吉卜力工作室风格的艺术作品。Amazon 也宣布计划在今年晚些时候推出一个"任意转换"模型。

这些全能模型需要大量的训练数据——包括图像、视频、音频、文本等。Hassabis 暗示 Veo 的视频数据主要来自 Google 旗下的 YouTube 平台。

Hassabis 表示："基本上，通过观看大量的 YouTube 视频，Veo 2 可以理解世界的物理规律。"

Google 此前向 TechCrunch 表示，其模型"可能"会按照与 YouTube 创作者的协议，使用"部分" YouTube 内容进行训练。据报道，Google 去年部分扩展了其服务条款，以允许公司获取更多数据来训练其 AI 模型。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

来源：Techcrunch

2025

04/11

10:03

分享

点赞

人工智能是否存在泡沫风险的深度分析

AI系统在压力下学会战略性欺骗的深层原因

数据中心备份电力系统对比分析

Paxos以超1亿美元收购加密钱包初创公司Fordefi

腾讯发布"读图神器"HunyuanOCR，只用1%的参数就打败了行业巨头？

联想天津工厂入选“世界智能制造十大科技进展” 以零碳智造打造业内标杆

联想万全异构智算研发团队入选IEEE CyberSciTech 2025，RNL技术成果获国际认可！

首款搭载千问的AI硬件：夸克AI眼镜新品发布 次日门店现排队潮

ServiceNow或以超10亿美元收购网络安全初创公司Veza

谷歌云推出"PanyaThAI"计划加速泰国AI应用

英国产学合作推进光纤射频通信技术商业化进程

阿里巴巴推出可换电池设计的Quark AI智能眼镜

WordPress.com 推出免费的 AI 网站构建器

大型机在 AI 时代是否仍有一席之地？

Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

ChatGPT 获得记忆增强升级，让对话体验更进一步

AI 推理模型的兴起使基准测试成本大幅提升

Google 推出企业级 AI 智能体开发套件，助力快速原型开发和部署

Google 推出性能更快、更高效的 Gemini AI 模型

AI 时代的领导力变革：2035 年的 5 个关键启示

Google 推出第七代 Ironwood TPU 芯片，借助 AI 进行性能对比

xAI 公司推出 Grok 3 API 服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

首款搭载千问的AI硬件：夸克AI眼镜新品发布次日门店现排队潮