根据Cloudflare发布的2025年度互联网回顾报告,ChatGPT的网络爬虫GPTBot已成为互联网上最受阻止的机器人,而其最大竞争对手谷歌则是最受允许的爬虫。更有趣的是,虽然ChatGPT是最受阻止的机器人,但实际上Anthropic的Claude AI引擎对网站所有者来说是最缺乏互惠价值的服务。
每年,互联网基础设施公司Cloudflare都会发布互联网现状分析报告。今年的重要发现包括:
互联网流量增长19%,星链流量激增130%。谷歌仍是最受欢迎的互联网平台,ChatGPT成为最受欢迎的AI问答引擎。Facebook依然是最受欢迎的社交服务,YouTube在流媒体领域获胜。非人类机器人现在占互联网流量的56.5%,而人类用户仅占43.5%。
机器人使用情况分析
机器人使用量已超过互联网活动的50%。最常见的机器人是谷歌和必应等搜索引擎机器人,但增长最快的是来自AI服务的机器人,它们希望获得谷歌已经掌握的所有信息。GPTBot在夏末的使用量激增了305%。
然而,一些网站所有者不希望AI了解他们提供的所有内容,因此通过robots.txt文件阻止AI爬虫。这是一种简单的方式来表达"不要查看我的内容"。值得注意的是,遵守这一规定完全是自愿的,AI服务Perplexity就被指控忽视robots.txt声明,无视限制继续爬取网站。
爬虫阻止与允许情况
2025年最受阻止的网络爬虫是OpenAI的GPTBot。第二受阻止的是CCBot,由一个声称维护开源网络内容数据库的非营利组织提供。谷歌的爬虫排名第三。
然而,由于人们仍希望从谷歌获得网络流量,谷歌的机器人也是互联网上最受允许的机器人,其次是微软的必应机器人,第三名是OpenAI的GPTBot。
这种看似矛盾的现象反映了不同网站所有者的不同策略。一些网站所有者希望被看到和使用,认为这有助于他们成长;而另一些则选择封闭,认为机器人在没有充分补偿的情况下夺取了价值。
爬取与推荐比率分析
Cloudflare提供的爬取推荐比率图表揭示了公司允许服务爬取其网站时的隐含交易条件。该比率很简单:我的网站被机器人分析或搜索多少次,相对于该服务向我发送多少真实人类用户。
传统搜索引擎在这方面表现最佳,相比AI引擎提供更多回报流量:
谷歌:约10比1(每发送1个访客需要10次爬取)
百度:约1比1
DuckDuckGo:约1比1
微软:约100比1(主要是必应)
Perplexity:约100比1
OpenAI/ChatGPT:约1000比1
Anthropic:约100000比1
作为网站所有者,1比1的爬取推荐比率几乎是理想状态,10比1还不错,100比1甚至1000比1都可以理解。但100000比1意味着大量爬取却几乎没有可察觉的回报。
其他有趣发现
Cloudflare 2025年雷达报告中最奇特的消息是,恶意和垃圾邮件最危险的域名是.christmas。因此在今年庆祝节日时,不要打开任何来自包含"Christmas"字样域名的邮件。
报告还显示,互联网中断的最大原因不是事故或灾难,而是政府指令关闭。美国占全球机器人流量的40%,5.6%的电子邮件包含恶意攻击。
Q&A
Q1:GPTBot为什么成为最受阻止的网络爬虫?
A:GPTBot是ChatGPT的网络爬虫,用于收集互联网信息并转化为知识。许多网站所有者认为AI机器人在没有充分补偿的情况下获取了他们的内容价值,因此选择通过robots.txt文件阻止GPTBot访问。同时,GPTBot的使用量在夏末激增了305%,增加了网站的负担。
Q2:爬取推荐比率是什么意思?
A:爬取推荐比率是指AI服务或搜索引擎爬取网站的次数与向该网站发送真实用户访问次数的比例。例如,谷歌的比率约为10比1,意味着每爬取10次会发送1个用户;而Anthropic的比率高达100000比1,意味着爬取10万次才发送1个用户,这对网站所有者来说价值极低。
Q3:为什么谷歌既是最受阻止也是最受允许的爬虫?
A:这反映了不同网站所有者的不同策略。谷歌作为最大的搜索引擎,一些网站希望被谷歌收录以获得流量,因此允许其爬虫;但另一些网站担心内容被过度利用而选择阻止。谷歌的爬取推荐比率相对合理(约10比1),比AI服务提供更多回报流量。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。