Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

Google DeepMind CEO Demis Hassabis透露，Google计划将Gemini AI模型与Veo视频生成模型结合，以增强AI对物理世界的理解。这一举措旨在创建多模态的"通用数字助手"，能在现实世界中为用户提供帮助。AI行业正逐步发展towards全能模型，能够理解和生成多种媒体形式。

在最近一期由 LinkedIn 联合创始人 Reid Hoffman 共同主持的 Possible 播客节目中，Google DeepMind 的 CEO Demis Hassabis 表示，Google 计划将其 Gemini AI 模型与 Veo 视频生成模型最终整合在一起，以提升前者对物理世界的理解能力。

Hassabis 说道："我们从一开始就将 Gemini（我们的基础模型）设计为多模态的。我们这样做是因为我们对通用数字助手有一个愿景，这个助手能够在现实世界中真正帮助到你。"

AI 行业正在逐步向"全能"模型发展——这类模型能够理解和合成多种形式的媒体内容。Google 最新的 Gemini 模型可以生成音频、图像和文本，而 OpenAI 在 ChatGPT 中的默认模型也能原生创建图像——当然也包括吉卜力工作室风格的艺术作品。Amazon 也宣布计划在今年晚些时候推出一个"任意转换"模型。

这些全能模型需要大量的训练数据——包括图像、视频、音频、文本等。Hassabis 暗示 Veo 的视频数据主要来自 Google 旗下的 YouTube 平台。

Hassabis 表示："基本上，通过观看大量的 YouTube 视频，Veo 2 可以理解世界的物理规律。"

Google 此前向 TechCrunch 表示，其模型"可能"会按照与 YouTube 创作者的协议，使用"部分" YouTube 内容进行训练。据报道，Google 去年部分扩展了其服务条款，以允许公司获取更多数据来训练其 AI 模型。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

来源：Techcrunch

2025

04/11

10:03

分享

点赞

重塑AI未来：TechCrunch Disrupt 2025 AI舞台阵容公布

英超联赛利用AI技术变革球迷体验

为创新而生 应启迪而造 AMD推出全新基于"Zen 5"架构的锐龙Threadripper 9000系列高端台式处理器

Runway推出Aleph模型，承诺下一代AI视频编辑体验

AI教父弗里·辛顿学术讲座：AI正在以我们想象不到的方式变得比人类更聪明

破除商用办公“效率悖论” 锐龙8000G开启战略突围！

英特尔代工业务目前首要任务是18A大规模量产

从社交媒体到钢铁制造：Dispo联合创始人的转型之路

AI时代的变革：Jensen Huang对人工智能的真实看法

TechCrunch出行：特斯拉与通用汽车的财报故事对比

Anthropic推出新的使用限制以控制Claude Code重度用户

微软Edge浏览器推出Copilot模式正式转型AI浏览器

WordPress.com 推出免费的 AI 网站构建器

大型机在 AI 时代是否仍有一席之地？

Gemini 和 Veo AI 模型将整合在一起，DeepMind CEO Demis Hassabis 宣布

ChatGPT 获得记忆增强升级，让对话体验更进一步

AI 推理模型的兴起使基准测试成本大幅提升

Google 推出企业级 AI 智能体开发套件，助力快速原型开发和部署

Google 推出性能更快、更高效的 Gemini AI 模型

AI 时代的领导力变革：2035 年的 5 个关键启示

Google 推出第七代 Ironwood TPU 芯片，借助 AI 进行性能对比

xAI 公司推出 Grok 3 API 服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

为创新而生应启迪而造 AMD推出全新基于"Zen 5"架构的锐龙Threadripper 9000系列高端台式处理器