Inception 从秘密研发中推出新型 AI 模型

Inception是一家位于帕洛阿尔托的新公司，由斯坦福大学计算机科学教授Stefano Ermon创立，声称开发了一种基于“扩散”技术的新型AI模型，称为扩散基础的大型语言模型（DLM）。目前备受关注的生成AI模型大致可分为两类：大型语言模型（LLMs）和扩散模型。Inception的模型结合了传统LLMs的功能，如代码生成和问答，但性能显著更快，计算成本更低。

总部位于帕洛阿尔托的新创公司 Inception，由斯坦福大学计算机科学教授 Stefano Ermon 创立，声称已开发出一种基于"扩散"技术的全新 AI 模型。Inception 将其称为基于扩散的大语言模型，简称"DLM"。

目前受到最多关注的生成式 AI 模型大致可分为两类：大语言模型 (LLM) 和扩散模型。基于 Transformer 架构的 LLM 主要用于文本生成。而扩散模型则为 Midjourney 和 OpenAI 的 Sora 等 AI 系统提供支持，主要用于创建图像、视频和音频。

据该公司介绍，Inception 的模型具备传统大语言模型的功能，包括代码生成和问答能力，但性能显著提升，且计算成本更低。

Ermon 告诉 TechCrunch，他在斯坦福实验室长期研究如何将扩散模型应用于文本。他的研究基于这样一个观察：与扩散技术相比，传统大语言模型相对较慢。

对于大语言模型，Ermon 表示："在生成第一个词之前你无法生成第二个词，在生成前两个词之前你也无法生成第三个词。"

Ermon 一直在寻找将扩散方法应用于文本的方式，因为与按顺序工作的大语言模型不同，扩散模型首先对要生成的数据 (如图片) 进行粗略估计，然后一次性将数据聚焦成型。

Ermon 提出假设，使用扩散模型可以并行生成和修改大块文本。经过多年尝试，Ermon 和他的一名学生取得了重大突破，并在去年发表的研究论文中详细说明了这一成果。

认识到这项进展的潜力，Ermon 于去年夏天创立了 Inception，并邀请两位前学生——UCLA 教授 Aditya Grover 和康奈尔大学教授 Volodymyr Kuleshov 共同领导公司。

虽然 Ermon 婉拒讨论 Inception 的融资情况，但据 TechCrunch 了解，Mayfield Fund 已投资该公司。

Emron 表示，Inception 已经获得了包括未具名的财富 100 强企业在内的多个客户，这些客户都急需降低 AI 延迟并提高处理速度。

"我们发现我们的模型能够更高效地利用 GPU，"Ermon 提到这些在生产环境中常用的计算机芯片时说，"我认为这意味着重大突破。这将改变人们构建语言模型的方式。"

Inception 提供 API 接口、本地部署和边缘设备部署选项，支持模型微调，并提供一套适用于各种场景的开箱即用 DLM。该公司声称其 DLM 的运行速度可达传统大语言模型的 10 倍，成本则降低至十分之一。

"我们的'小型'编程模型与 [OpenAI 的] GPT-4 mini 性能相当，但速度快 10 倍以上，"该公司发言人告诉 TechCrunch。"我们的'迷你'模型性能超过 [Meta 的] Llama 3.1 8B 等小型开源模型，每秒可处理超过 1,000 个 token。"

"Token"是业内用语，指原始数据的基本单位。如果 Inception 的声明属实，每秒处理 1,000 个 token 确实是一个令人印象深刻的速度。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Inception 从秘密研发中推出新型 AI 模型

来源：Techcrunch

2025

02/27

16:23

分享

点赞

Uber年度遗失物报告揭示：数千件物品遗留在无人驾驶出租车中

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

特斯拉在奥斯汀开始测试无方向盘无踏板Cybercab量产版

图灵奖得主Patterson：摩尔定律的真相，CPU、GPU、TPU的诞生与分工

Omdia报告：Dell PowerProtect助力企业三年期网络弹性TCO最高降低61%

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

PEAK:AIO AI 数据服务器性能峰值达到 120 GBps

ChatGPT 4.5 震撼发布：更大、更智能，但也更贵

Flora：为创意专业人士打造 AI 驱动的"无限画布"

OpenAI 计划将 Sora 视频生成器整合到 ChatGPT 中

新型 AI 文本扩散模型突破速度瓶颈，从噪声中提取文字

Inception 从秘密研发中推出新型 AI 模型

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

GenAI 时代的计算引擎策略

Adobe 发布带有多项免费功能的 iPhone 版 Photoshop

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: