最热门的 AI 模型:它们的功能和使用方法

当前,AI模型的推出速度令人眼花缭乱,从谷歌等大型科技公司到OpenAI和Anthropic等初创企业都在不断推出新模型。跟踪最新的AI模型可能会让人感到不知所措。AI模型通常根据行业基准进行宣传,但这些技术指标往往无法真实反映人们和公司如何实际使用它们。为了帮助读者理清思路,TechCrunch汇总了自2024年以来发布的最先进的AI模型概述,包括如何使用它们及其最佳应用场景。我们也会持续更新这个列表,添加最新的发布信息。

AI 模型正在以令人眼花缭乱的速度被推出,从 Google 等大型科技公司到 OpenAI 和 Anthropic 等初创公司都在参与其中。跟踪最新的模型可能会让人感到不知所措。

增加混乱的是,AI 模型通常基于行业基准进行推广。但这些技术指标往往很少揭示真实的人和公司实际如何使用它们。

为了帮助大家理清思路,TechCrunch 汇总了一份自 2024 年以来发布的最先进 AI 模型概述,详细介绍了如何使用它们以及它们的最佳用途。我们也会不断更新这份清单,以涵盖最新的发布。

实际上,市面上有超过一百万个 AI 模型:例如,Hugging Face 就托管了超过 140 万个。因此,这份清单可能会遗漏一些在某些方面表现更好的模型。

2025 年发布的 AI 模型:

Cohere 的 Aya Vision

Cohere 发布了一款名为 Aya Vision 的多模态模型,据称在图像字幕和回答照片相关问题等方面表现出色。与其他模型不同的是,它在非英语语言方面也表现优异。该模型可以在 WhatsApp 上免费使用。

OpenAI 的 GPT 4.5 “Orion”

OpenAI 称 Orion 是他们迄今为止最大的模型,具有强大的“世界知识”和“情感智能”。然而,与更新的推理模型相比,它在某些基准测试中表现不佳。Orion 可供 OpenAI 每月 200 美元计划的订阅者使用。

Claude Sonnet 3.7

Anthropic 称这是业界首个“混合”推理模型,因为它既可以快速给出答案,也可以在需要时深入思考。用户还可以控制模型思考的时间。Sonnet 3.7 对所有 Claude 用户开放,但重度用户需要每月 20 美元的 Pro 计划。

xAI 的 Grok 3

Grok 3 是由 Elon Musk 创立的初创公司 xAI 最新的旗舰模型。据称在数学、科学和编码方面优于其他领先模型。该模型需要 X Premium(每月 50 美元)。在一项研究发现 Grok 2 倾向于左翼后,Musk 承诺将 Grok 调整得更“政治中立”,但尚不清楚是否已实现。

OpenAI o3-mini

这是 OpenAI 最新的推理模型,专为与 STEM 相关的任务(如编码、数学和科学)优化。虽然不是 OpenAI 最强大的模型,但由于体积较小,公司称其成本显著降低。它可以免费使用,但重度用户需要订阅。

OpenAI 深度研究

OpenAI 的深度研究旨在对某个主题进行深入研究,并提供清晰的引用。此服务仅在 ChatGPT 每月 200 美元的 Pro 订阅中提供。OpenAI 推荐它用于从科学到购物研究的各种用途,但需要注意的是幻觉仍然是 AI 的一个问题。

Mistral Le Chat

Mistral 推出了 Le Chat 的应用程序版本,这是一款多模态 AI 个人助理。Mistral 声称 Le Chat 的响应速度比任何其他聊天机器人都快。它还有一个付费版本,提供来自 AFP 的最新新闻报道。Le Monde 的测试发现 Le Chat 的表现令人印象深刻,尽管错误比 ChatGPT 更多。

OpenAI Operator

OpenAI 的 Operator 意在成为一个可以独立完成任务的个人助理,比如帮助你购买杂货。它需要每月 200 美元的 ChatGPT Pro 订阅。AI 代理有很大的潜力,但仍处于实验阶段:一位《华盛顿邮报》的评论员表示,Operator 自行决定订购了 31 美元的一打鸡蛋,并用评论员的信用卡支付。

Google Gemini 2.0 Pro 实验版

Google Gemini 的备受期待的旗舰模型声称在编码和理解一般知识方面表现出色。它还具有 200 万 Token 的超长上下文窗口,帮助用户快速处理大量文本。该服务至少需要每月 19.99 美元的 Google One AI Premium 订阅。

2024 年发布的 AI 模型:

DeepSeek R1

这款中国 AI 模型在硅谷引起了轰动。DeepSeek 的 R1 在编码和数学方面表现良好,而其开源性质意味着任何人都可以在本地运行。此外,它是免费的。然而,R1 集成了中国政府的审查制度,并因可能将用户数据传回中国而面临日益增加的禁令。

Gemini 深度研究

深度研究将 Google 的搜索结果总结为一个简单且有良好引用的文档。该服务对学生和其他需要快速研究总结的人很有帮助。然而,其质量远不及实际的同行评审论文。深度研究需要每月 19.99 美元的 Google One AI Premium 订阅。

Meta Llama 3.3 70B

这是 Meta 最新且最先进的开源 Llama AI 模型版本。Meta 宣称这个版本是迄今为止最便宜和最有效的,特别是在数学、一般知识和指令遵循方面。它是免费和开源的。

OpenAI Sora

Sora 是一个基于文本创建逼真视频的模型。虽然它可以生成整个场景而不仅仅是片段,但 OpenAI 承认它经常生成“不现实的物理效果”。目前,它仅在 ChatGPT 的付费版本上可用,起价为每月 20 美元的 Plus。

阿里巴巴 Qwen QwQ-32B-Preview

该模型是少数在某些行业基准上能与 OpenAI 的 o1 媲美的模型之一,在数学和编码方面表现出色。讽刺的是,作为一个“推理模型”,它在常识推理方面“还有改进空间”,阿里巴巴表示。TechCrunch 的测试显示,它还包含了中国政府的审查制度。它是免费和开源的。

Anthropic 的计算机使用

Claude 的计算机使用旨在控制你的计算机以完成任务,如编码或预订机票,使其成为 OpenAI 的 Operator 的前身。然而,计算机使用仍处于测试阶段。定价通过 API:每百万输入 Token 收费 0.80 美元,每百万输出 Token 收费 4 美元。

xAI 的 Grok 2

Elon Musk 的 AI 公司 xAI 推出了其旗舰 Grok 2 聊天机器人的增强版本,声称“速度提高了三倍”。免费用户在 Grok 上每两小时限制提问 10 个问题,而 X 的 Premium 和 Premium+ 计划的订阅者享有更高的使用限制。xAI 还推出了一个名为 Aurora 的图像生成器,可以生成高度逼真的图像,包括一些图形或暴力内容。

OpenAI o1

OpenAI 的 o1 系列旨在通过隐藏的推理功能“思考”响应,从而产生更好的答案。OpenAI 声称该模型在编码、数学和安全性方面表现出色,但也存在试图欺骗人类的问题。使用 o1 需要订阅 ChatGPT Plus,每月 20 美元。

Anthropic 的 Claude Sonnet 3.5

Claude Sonnet 3.5 是一个 Anthropic 宣称为同类最佳的模型。它因其编码能力而闻名,被认为是技术内部人士的首选聊天机器人。该模型可以在 Claude 上免费访问,但重度用户需要每月 20 美元的 Pro 订阅。虽然它可以理解图像,但不能生成图像。

OpenAI GPT 4o-mini

OpenAI 宣称 GPT 4o-mini 是其迄今为止最实惠和最快的模型,得益于其小巧的体积。它旨在支持广泛的任务,如为客户服务聊天机器人提供动力。该模型在 ChatGPT 的免费层上可用。与更复杂的任务相比,它更适合高容量的简单任务。

Cohere Command R+

Cohere 的 Command R+ 模型在复杂的检索增强生成(或 RAG)应用中表现出色。这意味着它可以非常好地查找和引用特定的信息。 (RAG 的发明者实际上在 Cohere 工作。)不过,RAG 并没有完全解决 AI 的幻觉问题。

来源:Techcrunch

0赞

好文章,需要你的鼓励

2025

03/07

22:45

分享

点赞

邮件订阅