一个不太平静的时期降临到 Sam Altman 身上 — 先是 Elon Musk 的恶意收购,现在又出现了 Goku。字节跳动推出了 Goku,这是一个用于图像和视频生成的先进 AI 模型。这不仅对 OpenAI 和美国等试图确保 AI 技术访问权的政府构成了新的挑战,同时也降低了企业创造价值的门槛。为了抓住这个机遇,企业领导者必须优先提升 AI 素养。
什么是 Goku?
Goku 可以根据文本提示生成高质量的视觉内容。它使用校正流 Transformer,这是一种通过改善模型中信息流动方式来生成更流畅、更准确的图像和视频的 AI 模型。可以将其想象成一个不断完善笔触以使数字创作看起来更自然、更真实的高科技艺术家。最终将减少故障和失真。
像 Goku 这样的开源模型的崛起
Goku 是一个类似 Llama、DeepSeek 的开源 AI 模型。这对全球许多企业和初创公司来说是个好消息,但对 OpenAI 来说则是坏消息。事实越来越清楚,仅仅拥有最好的模型并不能确保长期成功。这也强调了模型"监管"可能无法按照美国设想的方式发挥作用。正如我之前所写:开源软件不能轻易被贸易壁垒限制。
真正的价值不在于 Goku 而在于其应用
Goku 与之前的其他模型一样,正在降低生产成本。我们在编程领域看到过这种情况,在写作领域也看到过,现在轮到视频领域了。像 Goku 和 Sora 这样的模型可以生成富有想象力的内容,比如"用炸鸡做成的鸡"。然而,真正的价值在于企业如何整合和利用 AI 生成的视频、文本和图像。
在营销中,我们向广告公司的创意总监征求想法。他们会提供 20 个不同的方案。但仅有创意还不够 — 真正的挑战在于决定选择这 20 个中的哪一个,以及如何有效地实施它们。我们的重点将从创作转向选择和实施。AI 的成功将取决于其实际应用。
AI 素养至关重要
为了帮助将 AI 和生成式 AI 整合到企业的各个环节,公司需要优先提升 AI 素养。自上而下的方式将不起作用,因为没有单一的 AI 应用。AI 将影响从营销和销售到客户体验和生产的每个方面。
因此,在 eCornell "设计和构建 AI 解决方案"认证课程中,我们探索了各个行业的 AI 应用。
深度伪造的风险
随着 AI 降低内容创作的门槛,滥用也变得更加容易。深度伪造 — AI 生成的旨在模仿真实人物的图像、视频和音频 — 带来严重风险。早在 2022 年,我就演示了它们是多么容易创建。这增加了虚假信息、身份盗窃和政治操纵的风险。
随着像 Goku 这样的工具使超现实内容的制作变得更加容易,负责任地使用 AI 和检测深度伪造必须成为优先事项。社会必须对数字内容保持更多怀疑,并投资于识别和对抗假冒的解决方案。再次强调,唯一有效的解决方法是投资于 AI 素养。
Goku 显示中国在 AI 领域的影响力日益增长
Goku 的崛起表明美国在 AI 领域的主导地位不再是板上钉钉。中国公司正在快速发展,强调 AI 素养和应用。要保持竞争力,组织必须理解并有效使用这些技术。
曾经无可匹敌的 OpenAI 现在面临激烈竞争。拥有最好的 AI 模型已经不够了。可持续的成功将取决于构建能使 AI 工具在现实场景中易于访问、适应和创造价值的生态系统。为此,OpenAI 需要资金,因此 Elon Musk 的提议相当具有毒性。
AI 的未来不仅将由像 Goku 这样的技术进步塑造,更重要的是由那些能够最好地实施这些技术的人来塑造。
好文章,需要你的鼓励
知名的投资机构ICONIQ Capital发布了《开发者手册:2025年AI现状报告》,基于对300位企业高管的调研,包括CEO、工程负责人、AI负责人和产品负责人等关键决策者,涵盖了从初创公司到十亿美元巨头的各个发展阶段,深度剖析了当下企业AI产品应用的全貌,为我们呈现了一个从"如何构思、交付和规模化AI驱动业务"的完整路线。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。