近期,DeepSeek 发布的 R1 模型震撼了人工智能领域。这款开源推理 AI 模型迅速获得开发者和研究人员的青睐。R1 的发布引发了市场剧烈反应,包括科技股的大幅抛售,特别是 Nvidia 等 AI 硬件和基础设施供应商的股票。这个时机格外引人注目,不仅因为 R1 的快速崛起,还因为与之同期发布的 Stargate 项目—— 一项针对 AI 数据中心的巨额投资计划。这些事件凸显了 AI 投资领域的深层不确定性,以及未来主导地位的商业模式仍悬而未决。
DeepSeek R1 与开源领域的颠覆性影响
DeepSeek 的 R1 模型被誉为与 OpenAI 的 GPT-4 和 Google 的 Gemini 等专有系统的强劲对手。与这些模型不同,R1 采用开放权重,这意味着任何人都可以使用、修改和在其基础上进行开发。这进一步加剧了开源系统与闭源 AI 系统孰优孰劣的争论。开源模型虽然推动了 AI 能力的民主化,但也给寻求投资变现的公司带来了挑战。如果企业可以简单地利用现有模型,加以改进后发布自己的版本,那么专有 AI 开发的投资回报就变得更加模糊。
这个问题正是 OpenAI 最近指控的核心,即 DeepSeek 使用蒸馏等技术基于 OpenAI 的输出训练其模型,可能违反了 OpenAI 的服务条款协议。这一争议突显了 AI 开发中的一个主要矛盾:如果没有明确的 AI 生成内容的产权规定,企业可能难以证明其巨额研发支出的合理性。
市场反应与 Nvidia 的处境
R1 的发布导致 Nvidia 股价大幅下跌,市值蒸发数千亿美元。Nvidia 一直是 AI 硬件的主导供应商,其 H100 和 H800 GPU 为最先进模型的训练和推理提供算力支持。DeepSeek 声称能以远低于美国竞争对手的成本开发高性能 AI,这引发了人们对 AI 运营是否会继续依赖昂贵的高性能芯片的质疑,或者软件优化是否能大幅降低成本。
与此同时,像 Stargate 项目这样的 AI 基础设施大型投资表明,尽管市场波动,一些投资者仍看好 AI 的长期潜力。然而,DeepSeek 可能的低成本训练方式与数十亿美元的数据中心投资形成鲜明对比,这立即引发了人们对这些投资是否会获得回报,或者新方法是否会使其过时的担忧。
对 DeepSeek 声明的质疑
尽管 DeepSeek 声称以相对较小的预算训练其 R1 模型,但这些说法的准确性存在重大疑问。独立分析表明,DeepSeek 的实际支出可能远超其公开披露的数额,估计该公司拥有包含数万个高性能 GPU 的庞大 AI 基础设施。如果属实,这意味着 DeepSeek 关于更具成本效益的 AI 开发的说法具有误导性。此外,DeepSeek 对现有 AI 模型的依赖可能会因违反知识产权法而影响其方法的长期可行性。
AI 投资的未来:谁将胜出?
AI 的快速发展使投资者面临多重不确定性:
硬件 vs 软件:如果像 DeepSeek 这样的公司能更高效地训练模型,对尖端芯片的需求会下降吗?还是基础模型永远需要最先进的处理能力?
开源 vs 闭源:如果开源模型能与专有系统匹敌,闭源 AI 系统还能继续吸引资金吗?监管措施会偏向某一方吗?
商业化策略:AI 公司能产生可持续收入吗?还是会被低成本竞争对手侵蚀定价能力?
面对如此多的不确定性,有一点是明确的:政策制定者必须避免实施增加不确定性的繁重监管,比如抬高数据中心建设成本和限制能源获取。确保简化、可预测的许可程序并减少不必要的监管障碍,将有助于投资者在不断发展的 AI 领域中前行。虽然全球各国都在竞相监管 AI,但在如此变化多端的形势下,过度监管可能导致资源错配。
DeepSeek 的成功也引发了人们对政府对先进 AI 芯片出口管制效力的质疑。国会应该专注于明确 AI 模型相关的产权,而不是实施更多无效的 AI 监管。如果企业因广泛抄袭而无法收回投资,创新可能会放缓。同时,过于严格的知识产权法也可能阻碍投资和进步。
让投资者承担风险
政策制定者应该专注于简化 AI 数据中心许可程序,确保能源基础设施能支持 AI 运营的扩张,而不是用严苛的监管限制投资。持续投资将让市场力量决定哪些模型和商业策略能够成功。这意味着:
支持愿意在 AI 基础设施和模型开发方面承担风险的投资者。
确保知识产权规则明确且可执行,同时不扼杀创新。
减少许可延误和监管不确定性,使 AI 开发能够高效进行。
DeepSeek 的 R1 模型代表了 AI 发展的一个重要拐点。它暴露了市场脆弱性,引发了知识产权权利的争论,并为本已复杂的投资环境增添了不确定性。政府应该专注于促进竞争,让最好的创意脱颖而出,而不是急于监管。历史告诉我们,最好的创新往往源于冒险者获得实验的自由。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。