中国AI初创公司DeepSeek宣布对其最新旗舰AI模型V4-Pro进行大幅降价。该公司将模型价格下调75%,距离推出包括V4 Pro和V4 Flash在内的V4系列仅过去一个月。
此前,使用成本从每百万Token 0.0145美元(缓存命中)到每百万输出Token 3.48美元不等。调整后,V4 Pro的起始价格降至每百万Token 0.003625美元,最高为每百万Token 0.87美元。该公司表示,在2026年5月31日15:59 UTC的75%折扣促销结束后,DeepSeek V4 Pro模型API定价将正式调整为原价的1/4。
Greyhound Research首席分析师兼首席执行官Sanchit Vir Gogia表示:"V4-Pro的设计目标是降低长上下文推理的成本,据报道,在超长上下文情况下,其单Token计算量约为前代产品的四分之一,内存占用仅为十分之一。这就是价格下调是永久性而非促销性的原因。这不是折扣,而是效率提升带来的成本传导。"
在推出性能和成本效率兼具的R1推理模型近一年后,DeepSeek发布了V4大语言模型的预览版。与早期模型类似,V4也是开源的,允许开发者下载代码在本地运行甚至修改。新模型针对Anthropic的Claude Code和OpenClaw等流行智能体工具进行了优化。
Counterpoint Research副总裁Neil Shah表示:"从纯粹的能力角度来看,DeepSeek V4-Pro在复杂数学和推理等关键任务上有效缩小了性能差距,同时在开放性和推理成本方面积极引领市场。其专门的推理模式和架构增强使其成为西方前沿模型的强大替代品。"不过他补充说,其主要局限性不在于原始智能,而是在更广泛的生态系统采用、全球支持结构、清晰的知识产权来源以及AWS、微软和谷歌原生提供的深度安全超大规模云集成方面落后于西方竞争对手。
推理成本仍然是将试点项目扩展到组织级部署的最大障碍之一,专家表示,DeepSeek的激进折扣可能为企业带来可观的成本节省。
Gogia补充说,第一波企业AI浪潮充满了令人印象深刻的演示和令人不安的账单。首席信息官们很快了解到,AI的成本从来不只是模型调用,还包括检索、编排等更多内容。
然而,75%的降价只有在首席信息官能够大规模实际使用时才有意义。
Ankura Consulting高级董事总经理Amit Jaju解释说:"对于大多数企业来说,相关的比较不是DeepSeek的直接API,而是运行本地部署与使用任何外部推理提供商的成本。如果首席信息官可以在自己的基础设施上托管DeepSeek V4-Pro,推理成本会大幅下降,许多以前在规模上不经济的项目变得可行。这包括始终在线的副驾驶、批量文档审查、代码生成、一线支持和多智能体工作流。"他补充说,如果通过第三方提供商使用该模型,实际费率可能更高,投资回报率收益更小。
DeepSeek的折扣定价策略可能会加剧对主要AI供应商的压力,这些供应商的模型通常采用高溢价的企业定价。这可能促使OpenAI、Anthropic和谷歌等供应商推出更优惠的套餐。
Shah指出,Anthropic和OpenAI的高利润、高消费Token定价模型对于许多企业工作负载和工作流来说越来越难以证明其合理性。可行的开放权重替代方案的存在为企业买家提供了不错的议价能力。这可能会促使这些高端西方AI实验室逐步从基本的基于消费的定价转向更具防御性的、面向结果或基于价值的货币化模型。
因此,首席信息官也将采用多模型AI策略,类似于向多云架构的迁移。Gogia补充说:"这将形成一种AI组合架构,其中高端模型用于高风险工作,领域模型用于专业任务,小型模型用于可重复执行,以及一个编排层来路由、记录、治理和监控整个系统。"
尽管DeepSeek提供了成本优势,但首席信息官在评估中国来源的AI模型时应保持谨慎,仔细评估敏感数据暴露、监管合规和地缘政治依赖方面的风险。
Jaju补充说,主要风险是数据主权和跨境暴露。如果首席信息官依赖托管在中国的外部API,提示词、文档、嵌入、日志和遥测数据可能会离开企业边界,穿越具有不同法律制度的司法管辖区。
另一个重大风险是知识产权泄露,因为开发人员可能会将源代码、产品设计、法律草案、并购材料或事件数据粘贴到模型工作流中。如果模型是外部的,这些数据可能会被存储、用于训练或通过日志或插件暴露。
Jaju强调,第三个风险是监管可防御性。首席信息官需要明确数据在哪里处理、保留什么、谁可以访问、存在什么合同保护、模型是否可以自托管以及如何审计输出。
专家警告说,最安全的方式是在企业控制下的本地或主权云中托管DeepSeek,并配备加密、访问控制和审计跟踪。
Q&A
Q1:DeepSeek V4-Pro降价幅度有多大?
A:DeepSeek将V4-Pro模型价格下调了75%,从每百万输出Token 3.48美元降至0.87美元,每百万Token的起始价格从0.0145美元降至0.003625美元。在2026年5月31日促销结束后,价格将正式调整为原价的1/4。
Q2:DeepSeek降价会对OpenAI和谷歌等公司产生什么影响?
A:DeepSeek的激进降价策略将加剧对OpenAI、Anthropic和谷歌等主要AI供应商的压力,这些公司的高利润定价模型越来越难以证明合理性。这可能促使它们推出更优惠的套餐,并从基于消费的定价转向面向结果或基于价值的货币化模型。
Q3:企业使用DeepSeek模型需要注意哪些风险?
A:主要风险包括数据主权和跨境暴露问题、知识产权泄露风险以及监管合规性。如果使用托管在中国的外部API,企业数据可能离开企业边界进入不同法律制度的司法管辖区。专家建议最安全的方式是在企业控制下的本地或主权云中托管DeepSeek。
好文章,需要你的鼓励
随着制造商面临提升生产力、质量和韧性的压力,自动化正成为现代工厂运营的核心。全球最大合同制造商之一Flex近期扩大了与Teradyne Robotics的合作,将在自有工厂部署机器人解决方案并为客户制造关键机器人组件。该公司运营卓越与转型总裁分享了从试点项目到大规模实施的经验,探讨协作机器人、自主移动机器人如何平衡灵活性与标准化,以及物理AI在工厂环境中的实际应用前景。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
仓储自动化已进入新阶段,技术挑战从单一任务验证转向规模化部署。Plus One Robotics运营副总裁Christina Gomez-Terry分享了该公司累计完成20亿次拣选后的经验:硬件故障往往在大规模部署后才显现,可维护性和可靠性比峰值性能更重要,人机协作将是长期运营模式,而系统集成可能成为仓储自动化的下一个主要瓶颈。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。