法国人工智能初创公司Bioptomus是生物研究模型系列H-Optomus的开发先驱,今日宣布推出该公司新一代临床生物学AI模型H-Optomus-1,以及全球首个用于研究的通用多模态AI基础模型M-Optimus。
H-Optimus-1是该公司于2024年底发布的首个模型H-Optimus-0的迭代版本,目前是组织学领域领先的基础模型。组织学是通过显微镜研究生物组织以了解其结构的学科,主要揭示细胞如何组织成组织和器官的微观解剖结构。
Bioptomus表示,H-Optimus-1在组织分析方面取得了突破性进展,可辅助识别疾病和其他病理状况。该模型在多项综合性多任务、多器官基准测试中位居榜首,包括香港科技大学的PathBench和哈佛大学的HEST基准测试。
M-Optimus的发布标志着一个统一基础模型的诞生,该模型利用日益增长的多模态生物医学数据来促进生物学发现和发展。
该模型能够跨疾病和人群对细胞、组织和患者进行强大的表征建模,通过"数字孪生"技术提供预测临床结果的通用框架。这些数字孪生本质上是虚拟生物化身,可用于预测疾病进展和个体治疗反应。
通过为组织和疾病进展提供人工模拟基础,该模型可以指导治疗决策并扩展计算机驱动的临床试验规模。
Bioptimus联合创始人兼首席执行官让-菲利普·维尔特表示:"通过M-Optimus,我们成功组装了破解生物学密码之旅的第一批关键组件,实现了大规模结合多种模态的目标。"
Bioptomus将这一新模型描述为在全球最大专有数据集上训练的通用模型。训练数据整合了来自数百万患者、50多种器官类型和数百个医疗中心的精选信息,这种广泛覆盖为模型提供了深厚的生物多样性和深度。
M-Optimus帮助解决临床科学中的紧迫问题,包括使用直接多模态和组织学数据预测基因表达、治疗反应和结果。该公司表示,这为通过预测建模和模拟患者反应来加速药物设计开辟了机会。
生成组织、患者和人群数字孪生的能力使该模型能够协助大规模临床试验,大幅减少测试新型治疗方法的时间和成本。
长期以来,医学研究行业在分子级生物学与临床决策之间存在鸿沟,因为从实验室过渡到现实世界可能是一个充满挑战的过程。通过现实建模,实验室工作和临床试验可以针对核心机会进行定制,并覆盖边缘案例,避免重叠或"盲目尝试"。
研究人员还可以通过使用专有数据进行微调来训练自己的版本,在保留模型通用理解能力的同时保护企业私有信息。
在M-Optimus发布的同时,该公司宣布H-Optimus-1将通过亚马逊云科技的SageMaker平台广泛提供访问。SageMaker是该云计算公司用于构建、训练和部署AI模型的完全托管环境。
Q&A
Q1:H-Optimus-1模型的主要功能是什么?
A:H-Optimus-1是目前组织学领域领先的基础模型,在组织分析方面取得了突破性进展,可以辅助识别疾病和其他病理状况。该模型在香港科技大学的PathBench和哈佛大学的HEST等多项综合性多任务、多器官基准测试中位居榜首。
Q2:M-Optimus模型的数字孪生技术能做什么?
A:M-Optimus的数字孪生技术本质上是创建虚拟生物化身,可以用于预测疾病进展和个体治疗反应。通过为组织和疾病进展提供人工模拟基础,该技术可以指导治疗决策,协助大规模临床试验,大幅减少测试新型治疗方法的时间和成本。
Q3:M-Optimus模型使用了哪些训练数据?
A:M-Optimus在全球最大的专有数据集上进行训练,训练数据整合了来自数百万患者、50多种器官类型和数百个医疗中心的精选信息。这种广泛的数据覆盖为模型提供了深厚的生物多样性和深度,使其能够跨疾病和人群进行准确建模。
好文章,需要你的鼓励
据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
各行业企业存储的数据量持续攀升,5PB以上已成常态,10PB以上也日益普遍。2026年非结构化数据管理的主题是全面增长:更多数据、更多投资、更多痛点以及更多AI安全风险。AI应用加速普及、数字化信息激增以及富媒体和传感器数据大幅增加推动了数据增长。随着AI推理应用的发展,企业将意识到非结构化数据管理对AI投资回报率的关键作用。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。