我国宫颈癌每年新发病例约10万例,死亡人数约3万。在中国女性生殖系统恶性肿瘤中,宫颈癌的发病率和死亡率均位居第一。有效的筛查是减少甚至消除宫颈癌的重要举措。活检是宫颈癌最终诊断的金标准,活检前的阴道镜检查则是判断是否需要进行活检,以及确认活检位置的关键。过去,对阴道镜结果的判断十分依赖医生的主观经验,一旦出现误判,会直接耽误很多患者在癌变前期或早期癌变阶段获得及时诊疗。
人工智能的加入为电子阴道镜检查带来了破题思路。算法框架升级后的“腾讯觅影”AI电子阴道镜辅助诊断系统,可实现利用AI技术模拟医生读片过程,进行阴道镜下癌前病变辅助判读,辅助基层医生快速进行宫颈癌病变分级和活检点预测,有效提高阴道镜检查和活检诊断的准确率。相关研究的论文获《BMC Medicine》《IEEE Transactions On Medical Imaging》《Medical Image Analysis》及MICCAI等多个医学顶级期刊及会议收录。
同时,腾讯天衍实验室将进一步开放在智能阴道镜领域积累的研究成果,围绕活检预测、病灶分割、病变分级等宫颈癌AI辅助筛查中的痛点,启动AI竞赛,希望吸引更多的人工智能从业者关注宫颈癌早筛系统的开发,助力早日实现消除宫颈癌的目标。

“腾讯觅影”AI电子阴道镜辅助诊断系统提出的深度学习框架
腾讯天衍实验室提出的新模型,利用图网络技术对医生临床诊断过程进行模拟,并在图像输出特征上加入HPV和细胞学结果以提高宫颈癌病变分级的精度。另一方面,模型运用U-Net对阴道镜图像中的病灶区域进行分割,并利用YOLO网络对活检点进行预测,帮助医生更精确地对病人进行活检采样。
在宫颈癌筛查中,阴道镜检查通常需要在敷过醋酸的宫颈上采集不同时间段(醋酸后约60s,90s,120s和150s)的四张图像。然而在获取图像过程中经常会发生子宫颈移位问题,导致图像中宫颈位置不统一。腾讯天衍实验室提出了子宫颈检测网络,可从整个图像中识别出子宫颈的位置作为主要分析区域。
其次,图像中的潜在病变区域通常需要被放大观察,导致病变区域的显示形态发生变化,造成系统在进行图像分析时无法识别的问题。就此,腾讯天衍实验室采用了一种新的分析机制——特征库。该特征库将整个骨干网视为一个特征池,并从池中提取不同大小比例的特征图像,以重新校准图像。特征库的数据集还包含了原始(预醋酸)图像和醋酸后几个关键时间的阴道镜图像编码特征。利用具有边缘特征的图卷积网络(E-GCN)技术融合这些编码特征,可以对比并分析连续阴道镜图像,更准确地表示不同时间节点图像之间的关系,以充分获取醋酸测试过程中所包含的如“白度持续时间”等宝贵信息,尽可能地排除了仅针对单个醋酸后图像进行分析的局限性。
通过这一系列图网络技术,腾讯天衍实验室开发的新AI模型,对医生临床诊断过程进行模拟,并在图像输出特征上加入HPV和细胞学结果,有效地提高了宫颈癌病变分级的精度,帮助医生更准确地识别出需要进行活检的患者。
此外,腾讯天衍实验室提出的新框架模型还运用了U-Net对阴道镜图像中的病灶区域进行分割,并利用YOLO网络对活检点进行预测,为随后的活检提供指引。三万多张阴道镜检查图像由经验丰富的医学专家进行注释,形成的数据集被用于训练和评估这一深度学习框架。实验结果表明,升级后的系统实现了出色的分级精度,不仅优于现有算法,还优于经验丰富的医师。为了解决多中心影像数据差异的问题,一系列域适应(domain adaptation)技术亦被应用在系统中,对不同中心的阴道镜图片进行色彩与亮度上的统一,从而提升了系统的整体泛化性。
目前,宫颈癌筛查采用的是“三阶梯”法:第一步,医生会先用高敏感度的HPV病毒筛查或宫颈脱落细胞学检查(TCT或巴氏涂片)进行初筛检测;第二步,初筛阳性患者将被转诊到阴道镜检查的环节,根据阴道镜的检查结果,医生将做出是否需要活检的决定,并确定取活检的位置。第三步就是宫颈病理确诊。其中,阴道镜检查是“关键一步”,将很大程度上影响医生最终是否需要活检与取活检位置的确定。
然而,作为宫颈癌筛查流程中至关重要环节,基层阴道镜检查的推广遭遇了瓶颈:一方面我国懂得阴道镜检查和诊断的妇科医生资源不足,我国有80万妇科医生,但懂得阴道镜检查和诊断的医生不足1/20。另一方面,阴道镜检查诊断与质控管理能力容易受到医生主观经验的影响,由于目前的阴道镜检查技术过多地依赖专家的主观经验,缺少适合筛查应用的质控管理及辅助诊断功能,临床医生对阴道镜检查结果的判断会受图像质量、宫颈位置等干扰因素的影响,判断错误造成的活检不当,会影响筛查的准确性。
腾讯天衍实验室的研究突破,在辅助医生进行宫颈疾病的诊断上有着重要价值。通过十几万份阴道镜图像的培训和验证,AI电子阴道镜辅助诊断系统与病理学结果作为黄金标准的一致性达到了82.2%的高水平,并且高于阴道镜专家65.9%的原始阴道镜解释。上述研究表明,AI电子阴道镜辅助诊断系统可有效协助基层医院阴道镜技师,提升阴道镜技师诊疗水准,缩小三级医院与基层医院之间的诊断能力差距,提高宫颈癌筛查质量。
好文章,需要你的鼓励
OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文限制和"注意力预算"问题,系统采用上下文压缩和多代理架构来应对。使用时需要良好的软件开发实践,避免"氛围编程",确保代码质量和安全性。研究显示经验丰富的开发者使用AI工具可能反而效率降低。
香港大学研究团队发布GenieDrive技术,通过引入4D占用空间概念,让AI真正理解驾驶的物理规律。该系统能将复杂驾驶场景分解为物理预测和视频生成两步,解决了传统AI只会模仿、容易产生偏见的问题。测试显示其预测准确度提升7.2%,视频质量提升20.7%,且能准确响应各种驾驶指令,为开发更安全的自动驾驶系统提供了新范式。
英伟达与AI芯片竞争对手Groq达成非独家授权协议,将聘请Groq创始人乔纳森·罗斯、总裁桑尼·马德拉等员工。据CNBC报道,英伟达以200亿美元收购Groq资产,但英伟达澄清这并非公司收购。Groq开发的LPU语言处理单元声称运行大语言模型速度快10倍,能耗仅为十分之一。该公司今年9月融资7.5亿美元,估值69亿美元,为超200万开发者的AI应用提供支持。
这项由孟加拉国工程技术大学、澳大利亚莫纳什大学和卡塔尔计算研究所联合开展的研究,首次让网页机器人具备了"后悔能力"和"战略思维"。WebOperator系统通过树状搜索、安全回退和破坏性动作识别三大创新,在WebArena测试中达到54.6%成功率,显著超越以往记录。该技术有望革命性改变电子商务、办公自动化和内容管理等领域的效率和可靠性。