DeepSeek：关于这款 AI 聊天机器人应用你需要知道的一切

DeepSeek是一家中国人工智能实验室，其聊天机器人应用最近在应用商店排名飙升。该公司通过高效的计算技术训练AI模型，其表现引发了业界对美国AI领先地位和AI芯片需求的质疑。DeepSeek的崛起源于量化对冲基金，其模型性能出色且价格低廉，正在对AI行业产生重大影响。

DeepSeek 最近迅速走红。

中国 AI 实验室 DeepSeek 本周突然进入大众视野，其聊天机器人应用在 Apple App Store 和 Google Play 商店排名飙升至榜首。DeepSeek 采用计算效率极高的技术训练其 AI 模型，这让华尔街分析师和技术专家们开始质疑美国能否在 AI 竞赛中保持领先地位，以及对 AI 芯片的需求是否能够持续。

DeepSeek 是如何起家的？它又是如何快速获得国际声誉的？

DeepSeek 的交易员起源

DeepSeek 背后的支持者是中国量化对冲基金翻高资产管理 (High-Flyer Capital Management)，该基金利用 AI 来指导交易决策。

AI 爱好者梁文峰于 2015 年共同创立了翻高资产。据报道，梁文峰在浙江大学求学期间就开始涉足交易，并在 2019 年将翻高资产管理发展成一家专注于开发和部署 AI 算法的对冲基金。

2023 年，翻高资产成立了 DeepSeek 实验室，专门研究 AI 工具，与其金融业务分开。在翻高资产作为投资者之一的支持下，该实验室独立成为一家同名公司 DeepSeek。

从一开始，DeepSeek 就建立了自己的数据中心集群用于模型训练。但与中国其他 AI 公司一样，DeepSeek 也受到美国硬件出口禁令的影响。为了训练其最新模型之一，公司不得不使用 Nvidia H800 芯片，这是一款相比美国公司可用的 H100 芯片性能较弱的版本。

据说 DeepSeek 的技术团队普遍较为年轻。据报道，公司积极从中国顶尖大学招募 AI 领域的博士研究生。根据《纽约时报》报道，DeepSeek 还会招聘一些非计算机科学背景的人才，以帮助其技术更好地理解各种领域的知识。

DeepSeek 的强大模型

DeepSeek 于 2023 年 11 月发布了第一批模型 — DeepSeek Coder、DeepSeek LLM 和 DeepSeek Chat。但直到去年春天发布下一代 DeepSeek-V2 系列模型时，AI 行业才开始真正关注这家公司。

DeepSeek-V2 是一个通用的文本和图像分析系统，在各种 AI 基准测试中表现出色，而且运行成本远低于当时的同类模型。这迫使 DeepSeek 的国内竞争对手，包括字节跳动和阿里巴巴，不得不降低部分模型的使用价格，甚至将一些模型完全免费开放。

2024 年 12 月推出的 DeepSeek-V3 进一步提升了 DeepSeek 的知名度。

根据 DeepSeek 内部基准测试，DeepSeek V3 的性能超过了 Meta 的 Llama 等可下载的开源模型，以及像 OpenAI 的 GPT-4 这样只能通过 API 访问的"封闭"模型。

同样令人印象深刻的是 DeepSeek 的 R1"推理"模型。这个于 1 月发布的模型据称在关键基准测试中的表现可以与 OpenAI 的 o1 模型相媲美。

作为一个推理模型，R1 能够有效地进行自我事实核查，这有助于避免一些通常会让模型犯错的陷阱。与典型的非推理模型相比，推理模型需要更长的时间（通常多几秒到几分钟）来得出解决方案。但好处是它们在物理、科学和数学等领域往往更加可靠。

然而，R1、DeepSeek V3 和 DeepSeek 的其他模型也有一个缺点。作为中国开发的 AI，它们需要接受中国互联网监管机构的审查，以确保其响应"体现社会主义核心价值观"。例如，在 DeepSeek 的聊天机器人应用中，R1 不会回答关于天安门广场或台湾自治的问题。

颠覆性的商业策略

如果说 DeepSeek 有商业模式的话，目前还不太清楚具体是什么。该公司的产品和服务定价远低于市场价值，有些甚至完全免费。

DeepSeek 表示，效率突破使其能够保持极强的成本竞争力。但一些专家对公司提供的数据表示质疑。

无论如何，开发者们已经开始青睐 DeepSeek 的模型。这些模型虽然不是传统意义上的开源，但都采用允许商业使用的宽松许可证。根据托管 DeepSeek 模型的平台之一 Hugging Face 的 CEO Clem Delangue 表示，Hugging Face 上的开发者已经创建了超过 500 个基于 R1 的"衍生"模型，总下载量达到 250 万次。

DeepSeek 战胜更大更成熟的竞争对手的成功被描述为"颠覆 AI"和"过度炒作"。该公司的成功至少部分导致 Nvidia 的股价在周一下跌了 18%，并引发了 OpenAI CEO Sam Altman 的公开回应。

Microsoft 宣布 DeepSeek 已在其 Azure AI Foundry 服务上线，这是 Microsoft 为企业整合 AI 服务的平台。在第一季度财报电话会议上，当被问及 DeepSeek 对 Meta AI 支出的影响时，CEO Mark Zuckerberg 表示，在 AI 基础设施上的投资将继续成为 Meta 的"战略优势"。

同时，一些公司以及整个国家和政府都在禁用 DeepSeek，包括韩国。纽约州也禁止在政府设备上使用 DeepSeek。

至于 DeepSeek 的未来会如何，目前还不清楚。改进模型是必然的。但美国政府似乎越来越警惕其认为有害的外国影响。

来源：Techcrunch

0赞

好文章，需要你的鼓励

DeepSeek：关于这款 AI 聊天机器人应用你需要知道的一切

来源：Techcrunch

2025

02/26

18:31

分享

点赞

联想全面激活世界杯官方技术合作伙伴身份，天禧AI足球智能体重磅上线

AI测试成数智化合规必选项，驱动企业高质量发展

AI智能体漏洞挖掘成本骤降，Anthropic呼吁AI防御

Spotify年度盘点2025首次推出多人互动功能"盘点派对"

英国SAP用户因商业套件重启授权迷局感到困惑

AWS发布Graviton5定制CPU，为云工作负载带来强劲性能

美光放弃Crucial品牌：告别消费级存储市场

手机里的NPU越来越强，为什么AI体验还在原地踏步？

如何使用现有基础设施让数据做好AI准备

IT领导者快问快答：思科光网络公司首席数字信息官Craig Williams分享AI转型经验

Anthropic CEO警告AI行业泡沫化，批评"YOLO"式投资

雅虎利用AI实时总结橄榄球比赛精彩内容

基于 AI 的 API 被证明极易遭受攻击

Manychat获1.4亿美元资金 助力商业消息平台引入AI

Hitachi Vantara 添加了 Index Engines 的 AI 勒索软件检测

Rivian 推举 Cohere CEO 加入董事会，最新迹象显示该电动车制造商对 AI 持乐观态度

Camunda为Agentic AI 调度谱写新篇章

Superpower 希望在症状显现之前帮助人们检测并解决健康问题

为 agentic AI 构建安全的云基础设施

AI 令人震惊的转变：从工作工具到数字心理咨询师和生活教练

Meta 将使用 AI 将青少年置于更严格的账户设置

针对跑步者和运动员的 AI 探索：我们正取得巨大进展

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Manychat获1.4亿美元资金助力商业消息平台引入AI