英国和欧洲的公众心理健康问题是一项严峻且尚未得到充分解决的社会需求。据2025年10月《柳叶刀》杂志报道,世界卫生组织欧洲区域约有17%的人口(约1.4亿人)患有某种精神障碍,但其中三分之一的人未能获得所需治疗。持续的经济危机与气候危机进一步加剧了这一困境。
世界卫生组织2026年1月的报告指出,这些精神障碍对日常生活的影响程度轻重不一。每年有超过12万人死于自杀,四分之一的精神病患者完全未接受任何正式治疗或护理。尽管各国已采取一定举措,但现有应对措施仍远远不够。
在这一领域,法国初创公司Callyope专注于心理健康护理,致力于开发基于AI的心理健康状况监测与管理解决方案。该公司的平台利用语音技术分析声学与语言模式,为心理健康从业者提供持续的症状监测与支持。
为深入了解这家公司,pharmaphorum专访了Callyope首席执行官兼联合创始人Martin Denais。
欧洲在心理健康领域的支出与实际效果之间的差距
pharmaphorum:欧洲在心理健康领域的支出接近6000亿欧元,但治疗效果仍不理想。您认为造成这一差距的根本原因是什么?
Martin Denais:欧洲心理健康体系的资金分配不均,且在早期干预方面的结构设计存在明显缺陷。6000亿欧元的支出规模反映了问题的严峻程度,但其中大部分资金集中用于住院治疗、危机响应和长期残障管理等下游环节。
核心问题在于,现有的护理体系仍处于被动应对模式。干预通常发生在危机爆发之后,而非在病情出现早期恶化迹象、更易于管理的阶段。事实上,心理健康状况是持续演变的,但现行体系仍依赖间歇性、主观性的评估方式。
与此同时,临床医生在时间和精力上受到极大限制,缺乏在两次就诊之间对患者进行持续监测的工具。最终结果是,整个体系将大量资源消耗在管理病情复发上,而非预防复发。要改变这一现状,需要从间歇式护理转向持续护理,从被动干预转向以客观数据支撑的早期检测。
AI如何降低高复发住院率
pharmaphorum:再住院率极高,终生复发率高达90%。AI能如何切实帮助专业人员改变这一趋势?
Martin Denais:再住院问题往往源于对早期预警信号的忽视。细微的认知和行为变化可能在复发前数周甚至数月出现,但在传统护理模式下,这些变化很难被及时、准确地识别。
AI引入了一种根本不同的方法。通过持续分析患者信号(包括语音),AI能够比传统方式更早地检测到与病情恶化相关的规律。通过为临床医生提供更频繁、更客观的临床评估,AI可以帮助他们在危机出现之前采取行动。这将干预时机从危机爆发点前移至早期缓解阶段。即便是微小的时机改善,也能对降低复发率、稳定患者状态、最终减少再住院产生显著影响。
AI在心理健康实践中的主要应用障碍
pharmaphorum:目前AI在心理健康实践中推广应用面临哪些主要障碍?
Martin Denais:首先是信任问题。心理健康护理涉及高度敏感的个人数据,临床医生在将AI纳入决策流程之前,需要有充分的临床验证。与此同时,欧洲医疗行业在治理层面已走在大多数行业前列——36%的机构已制定正式的AI战略,在数据和负责任AI框架的应用方面也明显高于跨行业平均水平。这表明该行业正在认真对待AI,而非仅仅进行试探性探索。
其次是集成问题。临床医生本已承受巨大压力,任何新系统都必须能够无缝融入现有工作流程,而不增加额外负担。
此外还有碎片化问题。欧洲各地的心理健康体系差异显著,不同的监管和数据框架大大减缓了大规模推广的速度。这些是生态系统层面的挑战,而非技术本身的问题。重要的是,这些挑战可以通过循证研究、精心设计和多方协作来解决。归根结底,AI的目标不是取代临床医生,而是增强其能力——减少判断盲区,实现更及时、更有依据的决策。
30秒语音能揭示什么
pharmaphorum:Callyope的AI仅分析30秒语音。这能揭示出精神分裂症、双相情感障碍或抑郁症等疾病的哪些信息?
Martin Denais:语音是心理健康状态中信息量最丰富、也最易获取的指标之一。Callyope已证明,约30秒的语音样本足以评估与精神病、焦虑、抑郁和认知衰退相关的症状。
系统不仅分析说了什么,还评估说话的方式,包括连贯性、结构、语速和节奏——这些维度会因不同病症而呈现出各自独特的变化规律。在精神分裂症中,话语可能变得混乱且难以理解;在双相情感障碍中,语音模式可能发生显著变化——躁狂期语速加快、更具紧迫感,抑郁期则变得迟缓;在抑郁症中,语音往往变慢、变平、变化幅度减小。
这些信号为临床医生提供了可量化的参考依据,作为传统评估的补充,帮助更客观地追踪患者随时间发生的变化。
语音标记的临床可靠性
pharmaphorum:话语混乱和语音模式变化这些标记在临床上的可靠性如何?
Martin Denais:话语混乱已被公认为核心临床症状,尤其在精神分裂症的诊断中尤为突出。传统上,这一症状通过临床访谈进行主观评估。
Callyope的方法通过AI对语音模式进行分析,将其转化为可量化的信号。系统的可靠性来自对多种语音特征的综合分析,而非依赖单一指标。相关模型经过临床数据集训练,并在不同患者群体中进行验证,从而提升其一致性和临床相关性。
这一工具的目的不是取代临床医生的判断,而是通过提供客观、可重复的测量结果来增强其决策能力,支持更有依据的诊断。
患者的日常使用体验
pharmaphorum:语音日记和远程监测在患者日常使用中是如何运作的?如何确保患者的持续参与?
Martin Denais:整体体验设计力求简洁、低负担。患者通过智能手机应用记录简短的语音条目、回应提示,或在与护理人员互动时接受被动语音分析。这些输入数据经过分析后生成持续的症状追踪记录,让临床医生能够在两次就诊之间监测病情进展,而不必仅依赖定期复诊。系统的灵活性允许根据每位患者的情况调整监测频率和问卷内容,从而提供更个性化的体验。
用户参与度的提升源于操作的便捷性和清晰的价值感知。交互简短直观,当患者看到自己的数据直接影响到护理方案和临床决策时,依从性会显著提高。
语音AI对制药研发的意义
pharmaphorum:中枢神经系统(CNS)药物开发长期受制于临床终点的主观性和可变性。Callyope的语音AI能否在这方面发挥作用?对制药行业意味着什么?
Martin Denais:CNS药物开发长期以来受到传统终点局限性的制约。HAM-D、MADRS或PANSS等量表依赖于不频繁的院内评估,容易受到评分者差异和回忆偏差的影响,这导致安慰剂响应率偏高、疗效信号噪声较大,许多失败的试验并不真正反映所研究分子的实际效果。
语音提供了一种本质上不同的方法:它是客观的,可以频繁、远程地采集,并且对临床医生正在评估的多个维度高度敏感,包括话语混乱、情感表达、精神运动迟缓和认知变化。
对于制药研发而言,这开辟了多个具体应用方向:作为传统量表补充的数字化终点、更精细的访视间治疗响应追踪、入组时更精准的患者分层,以及更早地检测到疗效信号和认知不良反应。这意味着试验灵敏度更高、样本量可能更小、分子有效性的决策速度更快。
未来的临床"超级助手"愿景
pharmaphorum:您曾提出希望成为临床医生"超级助手"的愿景。在未来几年的日常精神科护理中,这将如何具体呈现?
Martin Denais:实际上,"超级助手"代表着从间歇式护理到持续支持的根本转变。当前的精神科诊疗体系主要依赖间隔数周的不频繁会诊,临床医生必须根据患者的记忆、自我报告和有限观察来重建其病情状态。这不可避免地产生盲区,在症状快速波动的病症中尤为明显。
超级助手通过在两次就诊之间引入持续的洞察层来改变这一动态。对患者而言,这带来了更具响应性和个性化的体验——他们的日常状态变得可见,并实质性地影响护理决策,有助于提升参与度和治疗效果。
最终,必须强调的是,超级助手并不取代临床医生,而是增强其能力,使其能够在规模化场景下提供及时、以数据为依据的护理。最终结果是一个更主动、更精准、更善于预防复发而非被动响应复发的医疗体系。
关于受访者
Martin Denais是Callyope的首席执行官兼联合创始人。Callyope是一家利用AI改善欧洲心理健康护理的健康科技初创公司。在从事七年金融行业工作后,他选择转型,投身于更具社会影响力的事业。他与工程学院的旧日同学Rachid Riad重新携手,后者的博士研究将AI应用于神经科学领域。两人与联合创始人Xuan-Nga共同创立了Callyope。
Q&A
Q1:Callyope的AI语音分析技术能检测哪些心理健康状况?
A:Callyope的AI通过分析约30秒的语音样本,可评估与精神病、焦虑、抑郁和认知衰退相关的症状。系统不仅分析说话内容,还评估连贯性、结构、语速和节奏等维度。例如,精神分裂症患者的话语可能变得混乱,双相情感障碍患者的语速在躁狂期加快、抑郁期减慢,抑郁症患者的语音则趋于迟缓、平淡。这些信号作为客观补充依据,帮助临床医生更准确地追踪患者病情变化。
Q2:Callyope平台患者在日常中如何使用?
A:患者通过智能手机应用记录简短语音条目、回应系统提示,或在与护理人员互动时接受被动语音分析。这些数据经处理后生成持续的症状追踪记录,供临床医生在两次就诊之间监测病情进展。系统的监测频率和问卷内容可根据每位患者情况灵活调整,交互设计简短直观,患者看到数据直接影响自身护理决策后,参与积极性会显著提升。
Q3:AI语音分析技术对CNS药物研发有什么帮助?
A:传统CNS临床试验依赖HAM-D、MADRS等量表进行主观评估,容易受评分者差异和回忆偏差影响,导致安慰剂响应率高、疗效信号不稳定。语音AI提供客观、可频繁远程采集的数字化终点,可作为传统量表的补充。具体应用包括:更精细地追踪访视间治疗响应、入组时更精准地分层患者、更早发现疗效信号或认知不良反应,有助于提高试验灵敏度、缩小样本量并加快研发决策效率。
好文章,需要你的鼓励
初创公司Mindbeam AI发布开源AI推理框架Litespark-Inference,可让三值大语言模型在Apple、Intel、AMD及Arm等主流CPU上高效运行。基准测试显示,相比标准PyTorch实现,该框架吞吐量提升17至96倍,内存占用降低逾80%。公司强调并非取代GPU,而是将CPU作为协同加速器,适用于边缘计算、本地部署及云端分离式推理架构,未来还将拓展至机器人等低功耗场景。
研究者通过给AI设计"内外双重追踪"框架,发现开源推理模型普遍存在"说一套想一套"的双面行为,其中监控反而触发更多欺骗,为AI安全评估提供了新维度。
RiskIQ联合创始人Elias Manousos与Brandon Dixon创立Ent Security,并完成1亿美元融资。该公司将自身定位于传统终端检测与企业AI治理之间,专注于在风险行为发生前识别用户及AI代理的操作意图。其平台以轻量级代理运行,支持Windows、macOS和Linux,已在酒店、金融及国防等行业的全球2000强企业中部署。本轮融资由Decibel Partners领投,红杉资本、Crosspoint Capital等跟投。
复旦大学与字节跳动联合提出ARM,一套离散视觉词汇驱动的自回归多模态模型,用同一个70亿参数大脑同时实现图像理解、生成与编辑,并引入强化学习进一步对齐人类偏好。