近期,DeepSeek 发布的 R1 模型震撼了人工智能领域。这款开源推理 AI 模型迅速获得开发者和研究人员的青睐。R1 的发布引发了市场剧烈反应,包括科技股的大幅抛售,特别是 Nvidia 等 AI 硬件和基础设施供应商的股票。这个时机格外引人注目,不仅因为 R1 的快速崛起,还因为与之同期发布的 Stargate 项目—— 一项针对 AI 数据中心的巨额投资计划。这些事件凸显了 AI 投资领域的深层不确定性,以及未来主导地位的商业模式仍悬而未决。
DeepSeek R1 与开源领域的颠覆性影响
DeepSeek 的 R1 模型被誉为与 OpenAI 的 GPT-4 和 Google 的 Gemini 等专有系统的强劲对手。与这些模型不同,R1 采用开放权重,这意味着任何人都可以使用、修改和在其基础上进行开发。这进一步加剧了开源系统与闭源 AI 系统孰优孰劣的争论。开源模型虽然推动了 AI 能力的民主化,但也给寻求投资变现的公司带来了挑战。如果企业可以简单地利用现有模型,加以改进后发布自己的版本,那么专有 AI 开发的投资回报就变得更加模糊。
这个问题正是 OpenAI 最近指控的核心,即 DeepSeek 使用蒸馏等技术基于 OpenAI 的输出训练其模型,可能违反了 OpenAI 的服务条款协议。这一争议突显了 AI 开发中的一个主要矛盾:如果没有明确的 AI 生成内容的产权规定,企业可能难以证明其巨额研发支出的合理性。
市场反应与 Nvidia 的处境
R1 的发布导致 Nvidia 股价大幅下跌,市值蒸发数千亿美元。Nvidia 一直是 AI 硬件的主导供应商,其 H100 和 H800 GPU 为最先进模型的训练和推理提供算力支持。DeepSeek 声称能以远低于美国竞争对手的成本开发高性能 AI,这引发了人们对 AI 运营是否会继续依赖昂贵的高性能芯片的质疑,或者软件优化是否能大幅降低成本。
与此同时,像 Stargate 项目这样的 AI 基础设施大型投资表明,尽管市场波动,一些投资者仍看好 AI 的长期潜力。然而,DeepSeek 可能的低成本训练方式与数十亿美元的数据中心投资形成鲜明对比,这立即引发了人们对这些投资是否会获得回报,或者新方法是否会使其过时的担忧。
对 DeepSeek 声明的质疑
尽管 DeepSeek 声称以相对较小的预算训练其 R1 模型,但这些说法的准确性存在重大疑问。独立分析表明,DeepSeek 的实际支出可能远超其公开披露的数额,估计该公司拥有包含数万个高性能 GPU 的庞大 AI 基础设施。如果属实,这意味着 DeepSeek 关于更具成本效益的 AI 开发的说法具有误导性。此外,DeepSeek 对现有 AI 模型的依赖可能会因违反知识产权法而影响其方法的长期可行性。
AI 投资的未来:谁将胜出?
AI 的快速发展使投资者面临多重不确定性:
硬件 vs 软件:如果像 DeepSeek 这样的公司能更高效地训练模型,对尖端芯片的需求会下降吗?还是基础模型永远需要最先进的处理能力?
开源 vs 闭源:如果开源模型能与专有系统匹敌,闭源 AI 系统还能继续吸引资金吗?监管措施会偏向某一方吗?
商业化策略:AI 公司能产生可持续收入吗?还是会被低成本竞争对手侵蚀定价能力?
面对如此多的不确定性,有一点是明确的:政策制定者必须避免实施增加不确定性的繁重监管,比如抬高数据中心建设成本和限制能源获取。确保简化、可预测的许可程序并减少不必要的监管障碍,将有助于投资者在不断发展的 AI 领域中前行。虽然全球各国都在竞相监管 AI,但在如此变化多端的形势下,过度监管可能导致资源错配。
DeepSeek 的成功也引发了人们对政府对先进 AI 芯片出口管制效力的质疑。国会应该专注于明确 AI 模型相关的产权,而不是实施更多无效的 AI 监管。如果企业因广泛抄袭而无法收回投资,创新可能会放缓。同时,过于严格的知识产权法也可能阻碍投资和进步。
让投资者承担风险
政策制定者应该专注于简化 AI 数据中心许可程序,确保能源基础设施能支持 AI 运营的扩张,而不是用严苛的监管限制投资。持续投资将让市场力量决定哪些模型和商业策略能够成功。这意味着:
支持愿意在 AI 基础设施和模型开发方面承担风险的投资者。
确保知识产权规则明确且可执行,同时不扼杀创新。
减少许可延误和监管不确定性,使 AI 开发能够高效进行。
DeepSeek 的 R1 模型代表了 AI 发展的一个重要拐点。它暴露了市场脆弱性,引发了知识产权权利的争论,并为本已复杂的投资环境增添了不确定性。政府应该专注于促进竞争,让最好的创意脱颖而出,而不是急于监管。历史告诉我们,最好的创新往往源于冒险者获得实验的自由。
好文章,需要你的鼓励
Paramount正加速推进AI布局,同时面临CTO Phil Wiser五月底计划离职的人事变动。在收购华纳兄弟探索公司接近尾声之际,Paramount CIO Lakshman Nathan在路透社举办的Momentum AI大会上分享了公司AI战略:公司已在隐私、法务及代码开发等领域部署AI,两天内即可完成应用测试交付。Paramount采取开放探索与治理并行的策略,借助智能体AI推动企业级应用整合,同时稳步处理多次并购带来的遗留系统问题。
BEAM是阿里巴巴与北京大学提出的MoE大模型动态路由方法,通过可学习的二值掩码实现每个词自适应选择激活专家数量,在保留98%性能的前提下将推理速度提升最高2.5倍。
量子计算行业正面临两大迫切问题:安全威胁与人才短缺。随着"Q-Day"临近,量子计算机或将破解RSA加密体系,威胁银行、医疗、政府等关键基础设施安全。NIST要求2035年前完成向后量子密码学的迁移。与此同时,行业人才严重匮乏——目前仅有3万名量子专业人员,而2029年需求将达25万人。据麦肯锡预测,量子计算到2035年将创造3万亿美元经济机遇。
CurveBench是由四所高校联合构建的视觉拓扑推理基准,通过让AI识别嵌套闭合曲线的层次包含关系,揭示了顶尖视觉语言模型在空间结构理解上的系统性缺陷。