近期,DeepSeek 发布的 R1 模型震撼了人工智能领域。这款开源推理 AI 模型迅速获得开发者和研究人员的青睐。R1 的发布引发了市场剧烈反应,包括科技股的大幅抛售,特别是 Nvidia 等 AI 硬件和基础设施供应商的股票。这个时机格外引人注目,不仅因为 R1 的快速崛起,还因为与之同期发布的 Stargate 项目—— 一项针对 AI 数据中心的巨额投资计划。这些事件凸显了 AI 投资领域的深层不确定性,以及未来主导地位的商业模式仍悬而未决。
DeepSeek R1 与开源领域的颠覆性影响
DeepSeek 的 R1 模型被誉为与 OpenAI 的 GPT-4 和 Google 的 Gemini 等专有系统的强劲对手。与这些模型不同,R1 采用开放权重,这意味着任何人都可以使用、修改和在其基础上进行开发。这进一步加剧了开源系统与闭源 AI 系统孰优孰劣的争论。开源模型虽然推动了 AI 能力的民主化,但也给寻求投资变现的公司带来了挑战。如果企业可以简单地利用现有模型,加以改进后发布自己的版本,那么专有 AI 开发的投资回报就变得更加模糊。
这个问题正是 OpenAI 最近指控的核心,即 DeepSeek 使用蒸馏等技术基于 OpenAI 的输出训练其模型,可能违反了 OpenAI 的服务条款协议。这一争议突显了 AI 开发中的一个主要矛盾:如果没有明确的 AI 生成内容的产权规定,企业可能难以证明其巨额研发支出的合理性。
市场反应与 Nvidia 的处境
R1 的发布导致 Nvidia 股价大幅下跌,市值蒸发数千亿美元。Nvidia 一直是 AI 硬件的主导供应商,其 H100 和 H800 GPU 为最先进模型的训练和推理提供算力支持。DeepSeek 声称能以远低于美国竞争对手的成本开发高性能 AI,这引发了人们对 AI 运营是否会继续依赖昂贵的高性能芯片的质疑,或者软件优化是否能大幅降低成本。
与此同时,像 Stargate 项目这样的 AI 基础设施大型投资表明,尽管市场波动,一些投资者仍看好 AI 的长期潜力。然而,DeepSeek 可能的低成本训练方式与数十亿美元的数据中心投资形成鲜明对比,这立即引发了人们对这些投资是否会获得回报,或者新方法是否会使其过时的担忧。
对 DeepSeek 声明的质疑
尽管 DeepSeek 声称以相对较小的预算训练其 R1 模型,但这些说法的准确性存在重大疑问。独立分析表明,DeepSeek 的实际支出可能远超其公开披露的数额,估计该公司拥有包含数万个高性能 GPU 的庞大 AI 基础设施。如果属实,这意味着 DeepSeek 关于更具成本效益的 AI 开发的说法具有误导性。此外,DeepSeek 对现有 AI 模型的依赖可能会因违反知识产权法而影响其方法的长期可行性。
AI 投资的未来:谁将胜出?
AI 的快速发展使投资者面临多重不确定性:
硬件 vs 软件:如果像 DeepSeek 这样的公司能更高效地训练模型,对尖端芯片的需求会下降吗?还是基础模型永远需要最先进的处理能力?
开源 vs 闭源:如果开源模型能与专有系统匹敌,闭源 AI 系统还能继续吸引资金吗?监管措施会偏向某一方吗?
商业化策略:AI 公司能产生可持续收入吗?还是会被低成本竞争对手侵蚀定价能力?
面对如此多的不确定性,有一点是明确的:政策制定者必须避免实施增加不确定性的繁重监管,比如抬高数据中心建设成本和限制能源获取。确保简化、可预测的许可程序并减少不必要的监管障碍,将有助于投资者在不断发展的 AI 领域中前行。虽然全球各国都在竞相监管 AI,但在如此变化多端的形势下,过度监管可能导致资源错配。
DeepSeek 的成功也引发了人们对政府对先进 AI 芯片出口管制效力的质疑。国会应该专注于明确 AI 模型相关的产权,而不是实施更多无效的 AI 监管。如果企业因广泛抄袭而无法收回投资,创新可能会放缓。同时,过于严格的知识产权法也可能阻碍投资和进步。
让投资者承担风险
政策制定者应该专注于简化 AI 数据中心许可程序,确保能源基础设施能支持 AI 运营的扩张,而不是用严苛的监管限制投资。持续投资将让市场力量决定哪些模型和商业策略能够成功。这意味着:
支持愿意在 AI 基础设施和模型开发方面承担风险的投资者。
确保知识产权规则明确且可执行,同时不扼杀创新。
减少许可延误和监管不确定性,使 AI 开发能够高效进行。
DeepSeek 的 R1 模型代表了 AI 发展的一个重要拐点。它暴露了市场脆弱性,引发了知识产权权利的争论,并为本已复杂的投资环境增添了不确定性。政府应该专注于促进竞争,让最好的创意脱颖而出,而不是急于监管。历史告诉我们,最好的创新往往源于冒险者获得实验的自由。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。