OpenAI 于周二宣布,将向所有付费 ChatGPT 用户开放其网络浏览代理工具"深度研究"功能,该功能可以生成详尽的研究报告。
ChatGPT Plus、Team、Enterprise 和 Edu 订阅用户每月可获得 10 次深度研究查询机会。OpenAI 的深度研究功能此前仅向该公司每月 200 美元订阅的 ChatGPT Pro 用户开放;现在 Pro 用户每月可使用 120 次深度研究查询,较初始推出时的 100 次有所增加。
OpenAI、Google 和 Perplexity 正在竞相将各自的深度研究产品(这些产品基本都使用相同的名称并生成长篇报告)推广给更多用户。Google 上周已向所有 Gemini Advanced 用户开放了其深度研究代理工具。
科技公司希望深度研究工具能帮助用户认识到其昂贵 AI 订阅服务的价值。不过 OpenAI 指出,他们仍需要进行更多测试,以了解这些代理工具可能如何被用于说服他人。
好文章,需要你的鼓励
四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。
中南大学等机构联合发布TextAtlas5M数据集,包含500万图像-文本对,专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词,远超现有数据集,涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示,即使最先进的商业模型也面临显著挑战,为AI图像生成技术指明了新的发展方向。
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AGI的钥匙'。
剑桥大学研究团队创建了史上最难的AI视觉测试ZeroBench,包含100道精心设计的视觉推理题目。在这项测试中,包括GPT-4o、Claude、Gemini在内的20个全球最先进AI模型全部得了0分,暴露了当前AI在基础视觉理解上的严重缺陷。研究发现AI主要在计数、空间推理等基础任务上失败,而非逻辑推理能力不足。