ChatGPT成为互联网最受阻止的爬虫机器人

根据Cloudflare 2025年度报告，ChatGPT的爬虫GPTBot是互联网上被阻止最多的机器人，而其最大竞争对手谷歌则是最被允许的爬虫。报告显示，非人类机器人现占互联网流量的56.5%，其中AI服务爬虫增长最快。不同网站对爬虫态度各异，一些希望获得流量，另一些则认为机器人在未给予充分补偿的情况下获取价值。在爬取与推荐比率方面，Anthropic的表现最差，达到10万比1。

根据Cloudflare发布的2025年度互联网回顾报告，ChatGPT的网络爬虫GPTBot已成为互联网上最受阻止的机器人，而其最大竞争对手谷歌则是最受允许的爬虫。更有趣的是，虽然ChatGPT是最受阻止的机器人，但实际上Anthropic的Claude AI引擎对网站所有者来说是最缺乏互惠价值的服务。

每年，互联网基础设施公司Cloudflare都会发布互联网现状分析报告。今年的重要发现包括：

互联网流量增长19%，星链流量激增130%。谷歌仍是最受欢迎的互联网平台，ChatGPT成为最受欢迎的AI问答引擎。Facebook依然是最受欢迎的社交服务，YouTube在流媒体领域获胜。非人类机器人现在占互联网流量的56.5%，而人类用户仅占43.5%。

机器人使用情况分析

机器人使用量已超过互联网活动的50%。最常见的机器人是谷歌和必应等搜索引擎机器人，但增长最快的是来自AI服务的机器人，它们希望获得谷歌已经掌握的所有信息。GPTBot在夏末的使用量激增了305%。

然而，一些网站所有者不希望AI了解他们提供的所有内容，因此通过robots.txt文件阻止AI爬虫。这是一种简单的方式来表达"不要查看我的内容"。值得注意的是，遵守这一规定完全是自愿的，AI服务Perplexity就被指控忽视robots.txt声明，无视限制继续爬取网站。

爬虫阻止与允许情况

2025年最受阻止的网络爬虫是OpenAI的GPTBot。第二受阻止的是CCBot，由一个声称维护开源网络内容数据库的非营利组织提供。谷歌的爬虫排名第三。

然而，由于人们仍希望从谷歌获得网络流量，谷歌的机器人也是互联网上最受允许的机器人，其次是微软的必应机器人，第三名是OpenAI的GPTBot。

这种看似矛盾的现象反映了不同网站所有者的不同策略。一些网站所有者希望被看到和使用，认为这有助于他们成长；而另一些则选择封闭，认为机器人在没有充分补偿的情况下夺取了价值。

爬取与推荐比率分析

Cloudflare提供的爬取推荐比率图表揭示了公司允许服务爬取其网站时的隐含交易条件。该比率很简单：我的网站被机器人分析或搜索多少次，相对于该服务向我发送多少真实人类用户。

传统搜索引擎在这方面表现最佳，相比AI引擎提供更多回报流量：

谷歌：约10比1（每发送1个访客需要10次爬取）

百度：约1比1

DuckDuckGo：约1比1

微软：约100比1（主要是必应）

Perplexity：约100比1

OpenAI/ChatGPT：约1000比1

Anthropic：约100000比1

作为网站所有者，1比1的爬取推荐比率几乎是理想状态，10比1还不错，100比1甚至1000比1都可以理解。但100000比1意味着大量爬取却几乎没有可察觉的回报。

其他有趣发现

Cloudflare 2025年雷达报告中最奇特的消息是，恶意和垃圾邮件最危险的域名是.christmas。因此在今年庆祝节日时，不要打开任何来自包含"Christmas"字样域名的邮件。

报告还显示，互联网中断的最大原因不是事故或灾难，而是政府指令关闭。美国占全球机器人流量的40%，5.6%的电子邮件包含恶意攻击。

Q&A

Q1：GPTBot为什么成为最受阻止的网络爬虫？

A：GPTBot是ChatGPT的网络爬虫，用于收集互联网信息并转化为知识。许多网站所有者认为AI机器人在没有充分补偿的情况下获取了他们的内容价值，因此选择通过robots.txt文件阻止GPTBot访问。同时，GPTBot的使用量在夏末激增了305%，增加了网站的负担。

Q2：爬取推荐比率是什么意思？

A：爬取推荐比率是指AI服务或搜索引擎爬取网站的次数与向该网站发送真实用户访问次数的比例。例如，谷歌的比率约为10比1，意味着每爬取10次会发送1个用户；而Anthropic的比率高达100000比1，意味着爬取10万次才发送1个用户，这对网站所有者来说价值极低。

Q3：为什么谷歌既是最受阻止也是最受允许的爬虫？

A：这反映了不同网站所有者的不同策略。谷歌作为最大的搜索引擎，一些网站希望被谷歌收录以获得流量，因此允许其爬虫；但另一些网站担心内容被过度利用而选择阻止。谷歌的爬取推荐比率相对合理（约10比1），比AI服务提供更多回报流量。

来源：Forbes

0赞

好文章，需要你的鼓励

ChatGPT成为互联网最受阻止的爬虫机器人

来源：Forbes

2025

12/17

08:05

分享

点赞

星际之门AI数据中心建设雄心遭遇现实挑战

OKX推出AI智能体招聘与支付市场平台

AI编程Token成本将与开发者薪资持平，企业如何应对？

机器学习项目全生命周期管理的成功实践

SVT Robotics的Softbot平台交易量突破40亿笔

Agibot第15000台人形机器人下线，具身AI量产加速

杜尔为大众汽车建设跨工厂集成CO?高效涂装车间

AI对就业的影响：大规模裁员背后的真相与数据

AI重复申请问题推动电网转向"承诺优先"规划

美国消费品安全委员会拟出台电动自行车电池安全新规

江波龙：建设完成mSSD月产能百万交付能力！mSSD高速存储介质赋能端侧AI规模应用

从IO500双榜第一，看国产存储的系统级突破

英伟达推出开源权重模型填补美国AI市场空白

Meta推出SAM Audio模型：AI音频分离新突破

英伟达推动数据中心增长，以太网交换机销售创纪录

Quobyte推出GPU融合存储技术优化AI集群数据处理

艾伦人工智能研究所推出Molmo 2，为AI系统带来开放视频理解能力

Adobe Firefly新增基于提示词的视频编辑功能

英伟达考虑增产H200芯片满足中国市场激增需求

IBM推出开源智能体CUGA 任务完成率超五成

OpenAI支持的生物技术公司Chai Discovery获1.3亿美元B轮融资

塑造2026年的八大智能手机趋势

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: