谷歌推出了一款名为Scholar Labs的AI驱动搜索工具,专门用于回答详细的研究问题。这款新工具使用人工智能来识别用户查询中的主要主题和关系,目前仅对有限的登录用户开放测试。
谷歌称Scholar Labs能够"挖掘对用户研究任务最有用的论文"。该系统通过权衡每个文档的全文内容、发表位置、作者信息,以及在其他学术文献中被引用的频率和时间来对论文进行排名。谷歌表示,这种排名方式与研究人员自己的评估方式相同。
新工具的争议与局限
然而,Scholar Labs缺乏科学界常用的质量评估指标过滤功能。传统的学术搜索通常依靠引用次数和期刊影响因子来区分"优质"研究和"一般"研究。引用次数反映了一篇论文的受欢迎程度,而影响因子则体现了期刊在科学界的声誉和严格程度。
与原版Google Scholar不同,Scholar Labs不会根据论文的引用次数或期刊影响因子对结果进行排序或限制。谷歌发言人解释称,"影响因子和引用次数取决于论文的研究领域,大多数用户很难在特定研究问题的背景下猜测合适的数值。按影响因子或引用次数限制往往会错过关键论文,特别是跨学科领域或最近发表的文章。"
专家观点与实际应用
范德堡大学医学中心神经病学副教授Matthew Schrag认为,引用次数和影响因子是"对论文质量相当粗糙的评估",它们更多地反映了"论文的社会背景"而非质量本身。
塔夫茨大学康复科学教授James Smoliga是Google Scholar的频繁用户,他承认自己倾向于相信高引用论文更值得信赖,尽管他曾揭穿过一篇拥有数千引用的研究的方法问题。
与传统搜索工具的对比
相比之下,美国国立卫生研究院国家医学图书馆运营的PubMed等传统医学文献数据库,广泛使用过滤器和布尔逻辑搜索。用户可以将结果限制为仅显示临床研究的综述文章、排除预印本论文、按时间范围筛选等。
未来发展方向
Schrag认为AI驱动的搜索在科学生态系统中有其价值。理论上,它能够撒下更广的网,发现那些可能被忽视的论文,或者添加关于论文在社交媒体平台上受欢迎程度的额外背景信息。研究需要全面评估,AI可能能够解决这个问题。
不过,Schrag强调,科学家最终要对确定什么科学研究具有影响力负责。这需要阅读和参与科学文献,"成为最终的仲裁者,而不是让算法成为我们认为高质量研究的最终仲裁者。"
谷歌将Scholar Labs称为"我们的新方向",并计划在未来纳入用户反馈。目前该工具设有访问等待名单。
Q&A
Q1:Scholar Labs与传统Google Scholar有什么不同?
A:Scholar Labs使用AI来识别查询中的主要主题和关系,专门回答详细研究问题。与原版Google Scholar不同,Scholar Labs不会根据论文引用次数或期刊影响因子排序,而是通过权衡文档全文、发表位置、作者信息和被引用情况来排名。
Q2:为什么Scholar Labs不使用引用次数和影响因子作为筛选标准?
A:谷歌表示,影响因子和引用次数取决于研究领域,用户很难判断合适数值。按这些指标限制会错过关键论文,特别是跨学科领域或最近发表的文章。专家也认为这些指标更多反映论文社会背景而非质量。
Q3:科学家如何看待AI搜索工具在学术研究中的作用?
A:专家认为AI搜索有价值,能发现被忽视的论文并提供额外背景信息。但强调科学家应该是判断研究质量的最终仲裁者,需要通过阅读和参与科学文献来评估,而不能完全依赖算法判断。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。