如果你现在与医学科学联络员(MSL)交流,他们内心的紧张感会很快显现出来。
他们被明确告知,AI将成为其工作的一部分,而且不是遥远的、理论上的未来,而是眼下就需要开始使用的东西。与此同时,这一职业角色的核心价值却比以往任何时候都更加重要。他们仍然需要走进与临床医生的对话,并且必须做到精准。不是大致正确,不是方向正确,而是在科学证据层面经得起追问的正确。
这种矛盾让人不舒服,因为目前大多数公司广泛使用的通用AI工具,根本达不到这个标准。
目前正在发生的转变是:MSL不再需要在速度与科学严谨性之间二选一。新一代经过医学调优、以证据为基础的AI工具,正在将现场洞察、已发表的科学研究和学术会议成果整合到一个可追溯的工作流程中,逐步弥合这一差距。MSL不再依赖模糊不清、忽略不确定性的泛化摘要,而是可以从能够呈现证据来源、展示跨来源关联、并经得起审查的输出结果中开展工作。这将AI在现场中的角色,从便利工具升级为科学能力的倍增器。
从Medline到ChatGPT
几年前,工作流程虽然较慢,但方向明确。你在Medline上检索,查阅内部资源,提取文献,阅读原文,形成自己的判断,然后带着对每个观点来源的清晰认知走进对话。这需要时间,但经得起推敲。
而现在,许多MSL的工作方式已今非昔比。
他们越来越多地和其他人一样:打开ChatGPT、Gemini、Copilot,或者公司防火墙后面的某个工具,直接提问。有时问题很简单:这个疾病领域有什么动态?临床医生在面对哪些挑战?近期数据中出现了哪些趋势?答案在几秒钟内返回,措辞流畅,语气权威。
这恰恰是问题所在。
除非你对这个领域的了解已经深入到足以质疑这些答案,否则你根本不知道哪些内容被简化了、哪些内容缺失了,或者哪些内容根本是错的。AI研究领域有句话说得很准:AI始终充满自信,但只是有时候是对的。
这种风险以非常具体的方式显现。一位MSL走进与医生或关键意见领袖的讨论,重复了一个站不住脚的观点,整个对话的主导权就此改变。在这类对话中,信誉没有第二次机会。MSL这一职业角色的声誉,始终建立在一个前提之上:你可以相信MSL所说的话,因为它有证据支撑,而且是最新的证据。
面对AI,MSL分为两个阵营
部分MSL因感到别无选择而选择拥抱AI。医学事务管理层传递的信息已经足够清晰:"AI不会取代你,但会使用AI的人会。"
另一些人则在观望,仅将AI用于低风险任务,例如起草邮件或重新排版文件,因为他们不够信任AI,不敢将其用于科学对话。这类人往往是从业15年至20年的资深MSL,他们花了多年时间构建与临床医生的信任关系,不愿将其置于风险之中。
这两种立场都难以为继。两类人所面对的,其实是同一个根本问题:他们最容易获取的那些工具,根本不是为他们真正所做的工作而设计的。
这个角色的立身之本
历史上,MSL之所以有价值,部分原因在于其信息的独占性。对于时间有限的临床医生而言,MSL是获取最新科学成果并由懂得数据与临床背景双重语境的人加以解读的最高效渠道。
然而,这种独占性正在逐渐消解。临床医生如今也在自行使用大语言模型,用手机,在下班后,在那些无论如何都不会联系MSL的碎片时间里。但这并不意味着MSL价值的终结,而是一次重新定义——其价值所在之处正在迁移。
当信息本身变得更易获取,MSL的差异化价值在于他们如何处理这些信息:如何诠释、如何将其与临床医生在实际工作中的所见所闻相连接,并自信地阐明哪些结论站得住脚、哪些站不住脚。这需要成为质量与真相标准的守护者。
如今人人都可拥有的那种优势
我职业生涯早期,在一支欧洲实验性团队中担任MSL,每个国家通常只有一名MSL,而我负责覆盖四个国家。这让我拥有了大多数MSL所没有的东西:跨地区的视野。
我可以走进一场对话,分享法国正在发生什么、德国面临什么挑战、同一组数据在不同市场的反响如何。这让我具备了单一地区MSL无法复制的真实价值。
然而,这种优势不应该取决于个人际遇。
那种曾经需要依托同事网络和无数电话才能获得的跨地区洞察,现在应该对任何拥有合适工具的MSL开放。不仅仅是他们自己录入CRM的内容,而是跨地区同事所听到的信息、相互之间的对比,以及某位临床医生在伯明翰提出的问题,究竟是个例,还是在三个国家都有报告。这将从根本上改变对话的质量。
学术会议数据曾经的代价
学术会议的问题,是同一困境的另一个版本。
任何人都可以读摘要,难的是理解数据的落地情况:临床医生是否信任它,终点指标是否有实际意义,试验设计是否引发了疑虑。
过去,这些判断大多存在于无从记录的对话中,或者记录得太晚。等到两三周后那份由零散笔记拼凑而成的会议报告到达,时机早已错过。
而这些实时反应,恰恰是医学事务中最有价值的信号之一。前沿科学在这里首次公开,经验丰富的临床医生也在这里大声说出:某个终点是否可信,某组数据是否真正改变了他们的判断,某项试验设计是否遗漏了什么重要的东西。
当下已经可以实现的
这场转变真正的意义,不在于替代MSL的判断力,而在于消除围绕它的那些阻力。
当现场洞察、已发表证据和会议反响能够汇聚在同一个平台上,MSL就能看到以前看不到的东西。他们可以查询自己在本地听到的某个问题是否具有普遍性,可以带着对某位特定临床医生关注点的更清晰认识去准备一场对话,也可以将某位临床医生在会议中提出的问题,与不同市场的医疗专业人员长期以来的反映相连接。
这是一个不同层次的洞察,而它的实现,完全取决于能否信任工具的输出结果。
这正是通用大语言模型在MSL工作中仍然存在短板的地方。那些听起来合理的答案,依然可能是错误的、不完整的,或者缺失了对经验丰富的临床医生而言至关重要的背景信息。对于MSL来说,这种差距是不可接受的。信息来源必须可追溯,证据必须可验证。这个职业不是在变得不那么科学,恰恰相反,它正在变得更加科学。
最终将最有成效的MSL,是那些能够借助这些工具延伸自身专业能力,同时不让工具取而代之的人。
Q&A
Q1:生成式AI工具目前在MSL工作中存在哪些主要风险?
A:通用生成式AI工具最大的问题在于"自信但不一定正确"。MSL在与临床医生或关键意见领袖交流时,如果使用了听起来合理但实际上存在错误或缺失背景的AI输出内容,一旦被专业人士质疑,信誉就会受损且难以挽回。这类工具无法保证证据来源可追溯,也无法确保内容经得起科学层面的严格审查,因此不适合直接用于高要求的科学对话场景。
Q2:医学调优的AI工具与通用大语言模型相比有什么不同?
A:医学调优的AI工具专为MSL工作场景设计,能够将现场洞察、已发表的科学文献和学术会议数据整合到一个可追溯的工作流程中,输出内容会标注证据来源并呈现跨来源的逻辑关联。而通用大语言模型(如ChatGPT)则倾向于生成听起来流畅权威但可能模糊不确定性甚至出错的摘要,缺乏科学严谨性,不满足MSL工作对精准度的高要求。
Q3:MSL的核心价值在AI时代将如何演变?
A:随着临床医生也开始自行使用大语言模型获取信息,MSL的信息独占性正在减弱。但MSL的真正价值在于对信息的诠释能力:如何将数据与临床实践相连接,如何判断哪些结论站得住脚,以及如何将跨地区、跨会议的洞察整合为有价值的科学对话。AI工具的进步不是在取代这种判断力,而是在帮助MSL去除信息收集的阻力,让他们能将精力集中在真正体现专业价值的环节上。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。