根据Cloudflare发布的2025年度互联网回顾报告,ChatGPT的网络爬虫GPTBot已成为互联网上最受阻止的机器人,而其最大竞争对手谷歌则是最受允许的爬虫。更有趣的是,虽然ChatGPT是最受阻止的机器人,但实际上Anthropic的Claude AI引擎对网站所有者来说是最缺乏互惠价值的服务。
每年,互联网基础设施公司Cloudflare都会发布互联网现状分析报告。今年的重要发现包括:
互联网流量增长19%,星链流量激增130%。谷歌仍是最受欢迎的互联网平台,ChatGPT成为最受欢迎的AI问答引擎。Facebook依然是最受欢迎的社交服务,YouTube在流媒体领域获胜。非人类机器人现在占互联网流量的56.5%,而人类用户仅占43.5%。
机器人使用情况分析
机器人使用量已超过互联网活动的50%。最常见的机器人是谷歌和必应等搜索引擎机器人,但增长最快的是来自AI服务的机器人,它们希望获得谷歌已经掌握的所有信息。GPTBot在夏末的使用量激增了305%。
然而,一些网站所有者不希望AI了解他们提供的所有内容,因此通过robots.txt文件阻止AI爬虫。这是一种简单的方式来表达"不要查看我的内容"。值得注意的是,遵守这一规定完全是自愿的,AI服务Perplexity就被指控忽视robots.txt声明,无视限制继续爬取网站。
爬虫阻止与允许情况
2025年最受阻止的网络爬虫是OpenAI的GPTBot。第二受阻止的是CCBot,由一个声称维护开源网络内容数据库的非营利组织提供。谷歌的爬虫排名第三。
然而,由于人们仍希望从谷歌获得网络流量,谷歌的机器人也是互联网上最受允许的机器人,其次是微软的必应机器人,第三名是OpenAI的GPTBot。
这种看似矛盾的现象反映了不同网站所有者的不同策略。一些网站所有者希望被看到和使用,认为这有助于他们成长;而另一些则选择封闭,认为机器人在没有充分补偿的情况下夺取了价值。
爬取与推荐比率分析
Cloudflare提供的爬取推荐比率图表揭示了公司允许服务爬取其网站时的隐含交易条件。该比率很简单:我的网站被机器人分析或搜索多少次,相对于该服务向我发送多少真实人类用户。
传统搜索引擎在这方面表现最佳,相比AI引擎提供更多回报流量:
谷歌:约10比1(每发送1个访客需要10次爬取)
百度:约1比1
DuckDuckGo:约1比1
微软:约100比1(主要是必应)
Perplexity:约100比1
OpenAI/ChatGPT:约1000比1
Anthropic:约100000比1
作为网站所有者,1比1的爬取推荐比率几乎是理想状态,10比1还不错,100比1甚至1000比1都可以理解。但100000比1意味着大量爬取却几乎没有可察觉的回报。
其他有趣发现
Cloudflare 2025年雷达报告中最奇特的消息是,恶意和垃圾邮件最危险的域名是.christmas。因此在今年庆祝节日时,不要打开任何来自包含"Christmas"字样域名的邮件。
报告还显示,互联网中断的最大原因不是事故或灾难,而是政府指令关闭。美国占全球机器人流量的40%,5.6%的电子邮件包含恶意攻击。
Q&A
Q1:GPTBot为什么成为最受阻止的网络爬虫?
A:GPTBot是ChatGPT的网络爬虫,用于收集互联网信息并转化为知识。许多网站所有者认为AI机器人在没有充分补偿的情况下获取了他们的内容价值,因此选择通过robots.txt文件阻止GPTBot访问。同时,GPTBot的使用量在夏末激增了305%,增加了网站的负担。
Q2:爬取推荐比率是什么意思?
A:爬取推荐比率是指AI服务或搜索引擎爬取网站的次数与向该网站发送真实用户访问次数的比例。例如,谷歌的比率约为10比1,意味着每爬取10次会发送1个用户;而Anthropic的比率高达100000比1,意味着爬取10万次才发送1个用户,这对网站所有者来说价值极低。
Q3:为什么谷歌既是最受阻止也是最受允许的爬虫?
A:这反映了不同网站所有者的不同策略。谷歌作为最大的搜索引擎,一些网站希望被谷歌收录以获得流量,因此允许其爬虫;但另一些网站担心内容被过度利用而选择阻止。谷歌的爬取推荐比率相对合理(约10比1),比AI服务提供更多回报流量。
好文章,需要你的鼓励
亚马逊在CES期间宣布推出Alexa.com网站,用户可像使用其他AI聊天机器人一样与Alexa交互。经过数月早期体验,Alexa+已获得数千万用户。新网站支持语音和文本交互,需登录使用以确保跨设备功能连续性。76%的Alexa+交互为独特任务,包括智能家居控制和第三方集成。Alexa+兼容七年来的设备,正式版将收费每月20美元或包含在Prime会员中。
SimWorld是由UCSD等多所顶尖院校联合开发的革命性AI仿真平台,基于虚幻引擎5构建了具备真实物理规律的虚拟城市环境。该平台支持无限扩展的程序化世界生成和自然语言交互,让AI智能体能够在复杂环境中学会生存、合作和竞争,为通用人工智能的发展提供了前所未有的训练平台。
AI笔记公司Plaud在CES 2026推出新款可穿戴设备NotePin S,可夹在衣领、戴在手腕或挂在脖子上记录对话。该设备通过蓝牙连接手机,配备双麦克风,录制范围约3米,支持一键高亮标记重要时刻。同时发布的还有Plaud Desktop桌面AI记录工具,可原生捕获线上会议内容,无需机器人加入通话。两款产品将所有笔记、会议和对话整合到统一平台管理。
浙江大学联合华为提出C2DLM,这是一种因果概念引导的扩散语言模型,通过自动提取因果关系并融入注意力机制来增强AI推理能力。相比传统方法,C2DLM在推理任务上平均提升1.31%-12%,训练效率提高3.2倍,为解决语言模型推理能力不足开辟了新路径。