我测试了6个热门AI的准确性，结果发现它们表现出人意料

当今生成式AI工具最令人沮丧的缺陷之一就是事实错误。AI会产生幻觉，即提供包含事实性错误的信息。作者测试了ChatGPT、谷歌Gemini、微软Copilot、Claude AI、Meta AI和Grok AI等主流AI工具，向它们提出相同的系列问题。尽管部分AI提供了误导性信息，但整体表现尚可，这可能表明AI正变得更可靠。不过作者仍建议用户不要完全相信AI的回答，务必反复核实信息准确性。

当今生成式 AI 工具最令人沮丧的缺陷之一就是经常会提供错误的事实信息。AI 会产生幻觉，这意味着它们提供的信息包含事实错误或其他错误。

通常，错误以虚构细节的形式出现，当 AI 无法回答问题时就会出现这种情况。在这些情况下，它必须设计某种类型的回应，即使信息是错误的。有时你可以发现明显的错误；但有时，你可能完全没有意识到这些错误的存在。

为了看看哪些 AI 工具在提供准确可靠答案方面表现最佳，我测试了几个领先的 AI，具体包括 ChatGPT、Google Gemini、Microsoft Copilot、Claude AI、Meta AI 和 Grok AI。

我向每个 AI 提出了相同系列的问题，看看它们各自如何回应。在每种情况下，我都使用了 AI 的免费版本，没有使用任何高级功能或选项。

测试结果令人意外

虽然一些 AI 提供了误导性或不准确的信息，但它们整体表现相当好。我原本预期会收到更多的幻觉回答。但我向 AI 提出的大部分问题都得到了相对正确的答案。各个平台的回应基本一致，当我单独研究这些回应时，证明它们是准确的。

这次有限的测试可能表明 AI 正变得更加可靠，更不容易出错。除了依赖自己的内部数据外，大多数 AI 还会搜索互联网来研究主题并咨询多个来源。在过去，AI 也会误解它们在网上找到的信息。我记得有一次回应使用了我自己的一篇文章作为来源，但误解了我所写的内容。

重要提醒

当然，这一切都基于我有限的测试。一如既往，你绝不应该完全相信 AI 提供的信息。始终要双重检查和三重检查回应，确保细节正确。

Q&A

Q1：什么是AI幻觉？为什么会出现这种现象？

A：AI幻觉是指人工智能提供包含事实错误或其他错误的信息。通常在AI无法回答问题时，会虚构细节来提供某种类型的回应，即使这些信息是错误的。

Q2：测试中的AI工具整体表现如何？

A：虽然一些AI提供了误导性或不准确的信息，但它们整体表现相当好。大部分问题都得到了相对正确的答案，各个平台的回应基本一致，经过单独研究验证后证明是准确的。

Q3：如何正确使用AI工具避免错误信息？

A：绝不应该完全相信AI提供的信息。始终要双重检查和三重检查回应，确保细节正确。现在大多数AI会搜索互联网研究主题并咨询多个来源，但仍需要用户自己验证信息的准确性。

来源：ZDNET

0赞

好文章，需要你的鼓励

我测试了6个热门AI的准确性，结果发现它们表现出人意料

来源：ZDNET

2026

01/21

09:11

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

用Claude Code开发Mac应用8小时实战：比想象中更复杂

Google Gemini将为iPhone带来8+新功能

Anthropic研究人员绘制AI模型"人格地图"以驱逐"恶魔"人设

企业级AI PC的核心要求：不只是NPU性能

OpenAI盈利模式待解，CFO力劝投资者相信其未来

Quobyte平行文件系统在AI时代的静默性能与扩展优势

穆迪预测2030年数据中心投资将达3万亿美元

Tacnode发布智能体数据基础设施平台，专为AI决策优化

字母表市值破4万亿美元 英伟达统治AI工厂时代

劳埃德银行将培训全员掌握人工智能技能

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

字母表市值破4万亿美元英伟达统治AI工厂时代