近期,DeepSeek 发布的 R1 模型震撼了人工智能领域。这款开源推理 AI 模型迅速获得开发者和研究人员的青睐。R1 的发布引发了市场剧烈反应,包括科技股的大幅抛售,特别是 Nvidia 等 AI 硬件和基础设施供应商的股票。这个时机格外引人注目,不仅因为 R1 的快速崛起,还因为与之同期发布的 Stargate 项目—— 一项针对 AI 数据中心的巨额投资计划。这些事件凸显了 AI 投资领域的深层不确定性,以及未来主导地位的商业模式仍悬而未决。
DeepSeek R1 与开源领域的颠覆性影响
DeepSeek 的 R1 模型被誉为与 OpenAI 的 GPT-4 和 Google 的 Gemini 等专有系统的强劲对手。与这些模型不同,R1 采用开放权重,这意味着任何人都可以使用、修改和在其基础上进行开发。这进一步加剧了开源系统与闭源 AI 系统孰优孰劣的争论。开源模型虽然推动了 AI 能力的民主化,但也给寻求投资变现的公司带来了挑战。如果企业可以简单地利用现有模型,加以改进后发布自己的版本,那么专有 AI 开发的投资回报就变得更加模糊。
这个问题正是 OpenAI 最近指控的核心,即 DeepSeek 使用蒸馏等技术基于 OpenAI 的输出训练其模型,可能违反了 OpenAI 的服务条款协议。这一争议突显了 AI 开发中的一个主要矛盾:如果没有明确的 AI 生成内容的产权规定,企业可能难以证明其巨额研发支出的合理性。
市场反应与 Nvidia 的处境
R1 的发布导致 Nvidia 股价大幅下跌,市值蒸发数千亿美元。Nvidia 一直是 AI 硬件的主导供应商,其 H100 和 H800 GPU 为最先进模型的训练和推理提供算力支持。DeepSeek 声称能以远低于美国竞争对手的成本开发高性能 AI,这引发了人们对 AI 运营是否会继续依赖昂贵的高性能芯片的质疑,或者软件优化是否能大幅降低成本。
与此同时,像 Stargate 项目这样的 AI 基础设施大型投资表明,尽管市场波动,一些投资者仍看好 AI 的长期潜力。然而,DeepSeek 可能的低成本训练方式与数十亿美元的数据中心投资形成鲜明对比,这立即引发了人们对这些投资是否会获得回报,或者新方法是否会使其过时的担忧。
对 DeepSeek 声明的质疑
尽管 DeepSeek 声称以相对较小的预算训练其 R1 模型,但这些说法的准确性存在重大疑问。独立分析表明,DeepSeek 的实际支出可能远超其公开披露的数额,估计该公司拥有包含数万个高性能 GPU 的庞大 AI 基础设施。如果属实,这意味着 DeepSeek 关于更具成本效益的 AI 开发的说法具有误导性。此外,DeepSeek 对现有 AI 模型的依赖可能会因违反知识产权法而影响其方法的长期可行性。
AI 投资的未来:谁将胜出?
AI 的快速发展使投资者面临多重不确定性:
硬件 vs 软件:如果像 DeepSeek 这样的公司能更高效地训练模型,对尖端芯片的需求会下降吗?还是基础模型永远需要最先进的处理能力?
开源 vs 闭源:如果开源模型能与专有系统匹敌,闭源 AI 系统还能继续吸引资金吗?监管措施会偏向某一方吗?
商业化策略:AI 公司能产生可持续收入吗?还是会被低成本竞争对手侵蚀定价能力?
面对如此多的不确定性,有一点是明确的:政策制定者必须避免实施增加不确定性的繁重监管,比如抬高数据中心建设成本和限制能源获取。确保简化、可预测的许可程序并减少不必要的监管障碍,将有助于投资者在不断发展的 AI 领域中前行。虽然全球各国都在竞相监管 AI,但在如此变化多端的形势下,过度监管可能导致资源错配。
DeepSeek 的成功也引发了人们对政府对先进 AI 芯片出口管制效力的质疑。国会应该专注于明确 AI 模型相关的产权,而不是实施更多无效的 AI 监管。如果企业因广泛抄袭而无法收回投资,创新可能会放缓。同时,过于严格的知识产权法也可能阻碍投资和进步。
让投资者承担风险
政策制定者应该专注于简化 AI 数据中心许可程序,确保能源基础设施能支持 AI 运营的扩张,而不是用严苛的监管限制投资。持续投资将让市场力量决定哪些模型和商业策略能够成功。这意味着:
支持愿意在 AI 基础设施和模型开发方面承担风险的投资者。
确保知识产权规则明确且可执行,同时不扼杀创新。
减少许可延误和监管不确定性,使 AI 开发能够高效进行。
DeepSeek 的 R1 模型代表了 AI 发展的一个重要拐点。它暴露了市场脆弱性,引发了知识产权权利的争论,并为本已复杂的投资环境增添了不确定性。政府应该专注于促进竞争,让最好的创意脱颖而出,而不是急于监管。历史告诉我们,最好的创新往往源于冒险者获得实验的自由。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。