前沿模型的工作方式：与AI智能对话的新时代

前沿AI模型代表着当前最先进的人工智能系统，具备多模态处理、零样本学习和智能体行为等关键特征。以GPT-4o和Gemini 1.5为代表的前沿模型需要大量资源投入，面临成本与质量的平衡挑战。专家指出，基准测试既是推动发展的工具也存在被操控的风险。未来十年，这些模型将演变为无处不在的背景智能体，通过语音、凝视和情感识别与用户交互，彻底改变人机界面体验。

在行业内部，当人们讨论大语言模型的具体工作原理时，经常使用"前沿模型"这一术语。

但如果你不在这个行业内，可能并不真正了解这个概念的含义。你可以直观地理解"前沿"这个词，知道这些是各大公司正在推进的最新、最优秀的系统。

描述前沿模型的另一种方式是将其定义为"尖端"AI系统，具有广泛的应用目标，是提升AI能力的整体框架。

当被询问时，ChatGPT给出了三个标准——海量数据集、计算资源和复杂架构。

以下是前沿模型的一些关键特征，帮助你更好地理解这些模型的工作原理：

首先是多模态性，前沿模型很可能支持非文本输入和输出——包括图像、视频或音频。换句话说，它们能够看和听——不仅仅是读和写。

另一个重要特征是零样本学习，系统在更少提示下具备更强的能力。

还有那种类似智能体的行为，这让人们开始谈论"智能体AI"时代。

前沿模型的实例

如果你想玩"识别模型"游戏，具体了解哪些公司在推进这项研究，你可以说OpenAI的GPT 4o代表了一种前沿模型，具有多模态和实时推理能力。或者你可以推崇Gemini 1.5的能力，它同样是多模态的，具有不错的上下文处理能力。

你还可以指出许多其他在这类研究方面表现出色的公司例子...但是：深入了解这些系统的构建过程如何？

分析前沿技术格局

在最近的"行动中的想象力"小组讨论中，一组专家分析了在AI领域这一部分工作并创建这些前沿模型所需的条件。

小组主持人Peter Grabowski为前沿模型介绍了两个相关概念——质量与充分性，以及多模态性。

"我们已经看到了文本模型的大量工作，"他说。"我们看到了图像模型的很多工作。我们看到了一些视频或图像方面的工作，但你可以轻易想象，这只是未来发展的开始。"

Contextual AI的CEO Douwe Kiela指出，前沿模型需要大量资源，他提到"AI是一个非常资源密集的事业。"

Link Ventures的董事总经理Lisa Dolan说："我将成本与质量视为前沿，这些模型实际上只需要在特定数据上进行训练，但模型的稳健性是存在的。"（我也隶属于Link公司。）

Premji Invest的副总裁Vedant Agrawal说："我认为在性能方面仍有很大的增长空间。"

Agrawal还谈到了使用非专有基础模型的价值。

"我们可以采用其他人训练的基础模型，然后让它们变得更好，"他说。"所以我们真正专注于构成这些系统的所有组件，以及我们如何在它们各自的小类别中使用它们？"

基准测试和互操作性

小组还讨论了基准测试作为衡量这些前沿系统的方法。

"基准测试是一个有趣的问题，因为它单独来看既是研究世界中最好的东西，也是最糟糕的东西，"他说。"我认为它是好事，因为每个人都知道目标和他们努力的方向，但它也是坏事，因为你可以轻易地钻系统的空子。"

这种"钻系统空子"是如何工作的？Agrawal建议，真正以具体方式使用基准测试可能很困难。

"对于不深入研究领域的人来说，很难看着基准测试表格说，'好吧，你得了99.4分，而其他人得了99.2分，'"他说。"很难将0.2%的差异在现实世界中的真正含义进行情境化。"

Dolan说："我们会查看基准测试，因为我们必须报告它们，但存在大量的基准测试疲劳，所以没人相信它。"

后来，讨论了一些关于10倍系统的话题，以及收集和使用数据的一些方法：

· 识别合同业务数据 · 使用合成数据 · 标注员团队

当被问及这些系统的未来时，小组返回了这三个概念：

· AI智能体 · 跨学科技术 · 非变换器架构

观看视频了解小组关于前沿构建的其余评论。

前沿界面将是什么样子

这里有个有趣的补充——对于10年后我们将如何与这些前沿模型交互感兴趣，我向ChatGPT提出了这个问题。

以下是我得到的一些回答：

"你不会'打开'一个应用程序——它们将作为无处不在的后台智能体存在，响应语音、凝视、情感或任务提示...你的AI知道你在开会，它读取你的情绪状态，听到所说的话，并准备摘要+下一步行动——在你询问之前。"

这结合了两个方面，即新系统可能具有的模式和感觉。

这回到了个人化方法，我们开始更多地将这些模型视为同事和对话伙伴，而不是从计算机屏幕上凝视你的东西。

换句话说，PC-DOS命令行系统的时代已经结束。Windows将计算机界面从单行单色系统改变为充满活力的彩色窗口、重新构架和基于工具的桌面方法。

前沿模型将为我们的界面进展感知做得更多。

这将是巨大的变化。敬请关注。

来源：Forbes

0赞

好文章，需要你的鼓励

前沿模型的工作方式：与AI智能对话的新时代

来源：Forbes

2025

06/16

09:26

分享

点赞

苹果在印度恢复银行卡支付功能，距暂停已逾四年

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Ubuntu 25.10和Fedora 43的GNOME版本将放弃X11支持

SAP Sapphire 2025揭示AI驱动商业应用的重大转变

大规模开源安全应用所驱动的五大安全原则

Automattic收购关系管理应用Clay为在线工具增加身份层

Warp引入机器人技术实现仓储网络自动化

Meta发布新AI模型：能理解重力等物理规律

我们将如何与人工智能协作？探索人机合作新模式

AMD押注机架级计算架构，力争到2030年AI效率提升20倍

Multiverse Computing获2.15亿美元融资，推进量子启发AI模型压缩技术

Databricks全面发力企业AI：推出智能代理与数据库解决方案应对复杂性挑战

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: