谷歌推出了一款名为Scholar Labs的AI驱动搜索工具,专门用于回答详细的研究问题。这款新工具使用人工智能来识别用户查询中的主要主题和关系,目前仅对有限的登录用户开放测试。
谷歌称Scholar Labs能够"挖掘对用户研究任务最有用的论文"。该系统通过权衡每个文档的全文内容、发表位置、作者信息,以及在其他学术文献中被引用的频率和时间来对论文进行排名。谷歌表示,这种排名方式与研究人员自己的评估方式相同。
新工具的争议与局限
然而,Scholar Labs缺乏科学界常用的质量评估指标过滤功能。传统的学术搜索通常依靠引用次数和期刊影响因子来区分"优质"研究和"一般"研究。引用次数反映了一篇论文的受欢迎程度,而影响因子则体现了期刊在科学界的声誉和严格程度。
与原版Google Scholar不同,Scholar Labs不会根据论文的引用次数或期刊影响因子对结果进行排序或限制。谷歌发言人解释称,"影响因子和引用次数取决于论文的研究领域,大多数用户很难在特定研究问题的背景下猜测合适的数值。按影响因子或引用次数限制往往会错过关键论文,特别是跨学科领域或最近发表的文章。"
专家观点与实际应用
范德堡大学医学中心神经病学副教授Matthew Schrag认为,引用次数和影响因子是"对论文质量相当粗糙的评估",它们更多地反映了"论文的社会背景"而非质量本身。
塔夫茨大学康复科学教授James Smoliga是Google Scholar的频繁用户,他承认自己倾向于相信高引用论文更值得信赖,尽管他曾揭穿过一篇拥有数千引用的研究的方法问题。
与传统搜索工具的对比
相比之下,美国国立卫生研究院国家医学图书馆运营的PubMed等传统医学文献数据库,广泛使用过滤器和布尔逻辑搜索。用户可以将结果限制为仅显示临床研究的综述文章、排除预印本论文、按时间范围筛选等。
未来发展方向
Schrag认为AI驱动的搜索在科学生态系统中有其价值。理论上,它能够撒下更广的网,发现那些可能被忽视的论文,或者添加关于论文在社交媒体平台上受欢迎程度的额外背景信息。研究需要全面评估,AI可能能够解决这个问题。
不过,Schrag强调,科学家最终要对确定什么科学研究具有影响力负责。这需要阅读和参与科学文献,"成为最终的仲裁者,而不是让算法成为我们认为高质量研究的最终仲裁者。"
谷歌将Scholar Labs称为"我们的新方向",并计划在未来纳入用户反馈。目前该工具设有访问等待名单。
Q&A
Q1:Scholar Labs与传统Google Scholar有什么不同?
A:Scholar Labs使用AI来识别查询中的主要主题和关系,专门回答详细研究问题。与原版Google Scholar不同,Scholar Labs不会根据论文引用次数或期刊影响因子排序,而是通过权衡文档全文、发表位置、作者信息和被引用情况来排名。
Q2:为什么Scholar Labs不使用引用次数和影响因子作为筛选标准?
A:谷歌表示,影响因子和引用次数取决于研究领域,用户很难判断合适数值。按这些指标限制会错过关键论文,特别是跨学科领域或最近发表的文章。专家也认为这些指标更多反映论文社会背景而非质量。
Q3:科学家如何看待AI搜索工具在学术研究中的作用?
A:专家认为AI搜索有价值,能发现被忽视的论文并提供额外背景信息。但强调科学家应该是判断研究质量的最终仲裁者,需要通过阅读和参与科学文献来评估,而不能完全依赖算法判断。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。