微软公司正在组建一个新的工程团队,由去年加入公司的前 Meta Platforms Inc. 高管 Jay Parikh 领导。
微软首席执行官萨提亚·纳德拉今天在一份致员工的备忘录中宣布了这一任命。
这个新部门被命名为 CoreAI - 平台和工具组。它将为微软的 Copilot 系列人工智能产品开发技术。在今天的备忘录中,纳德拉特别强调了由公司旗下 GitHub 部门提供的 AI 驱动的编程助手 GitHub Copilot。
新团队还将致力于开发产品,帮助微软客户构建自己的机器学习服务,包括 AI 代理。这些是经过定制的神经网络,能够以高度自主的方式执行特定任务。纳德拉详细说明:"我们的目标是为第一方和第三方客户构建端到端的 Copilot 和 AI 技术栈,以构建和运行 AI 应用程序和代理。"
该团队将包含微软的多个现有团队。其中包括公司的 AI 平台部门和开发工具部门 Dev Div。后者负责开发市场上最受欢迎的代码编辑器之一 Visual Studio Code,以及随微软产品一起发布的软件开发工具包。SDK 是包含代码示例、调试工具和其他资源的软件包,旨在帮助开发者更轻松地采用云服务。
CoreAI - 平台和工具组还将包括来自微软 CTO 办公室的多个团队。其中包括负责衡量和提高公司开发效率的 Engineering Thrive 团队。微软的 AI 超级计算机和 AI 代理运行时部门也将成为新团队的一部分。
纳德拉写道:"我们将构建具有记忆、权限和行动空间的代理应用程序,这些应用程序将继承强大的模型能力。我们还将针对不同角色、业务流程和行业领域调整这些功能,以提升性能和安全性。"
CoreAI - 平台和工具组将由微软执行副总裁 Jay Parikh 领导,他于去年加入公司。此前,他是 Lacework Inc. 的首席执行官,这是一家专注于在云环境中发现漏洞和恶意代码的初创公司。该公司于今年 6 月被上市网络安全提供商 Fortinet Inc. 以 1.49 亿美元收购。
Parikh 此前是 Meta 的全球工程主管。在 Facebook 母公司任职期间,他在建设其数据中心网络方面发挥了关键作用。
纳德拉表示,Parikh 将与包括公司消费者 AI 组首席执行官 Mustafa Suleyman 在内的其他微软高管密切合作。Suleyman 在微软收购了他担任首席执行官的 OpenAI 竞争对手 Inflection AI Inc. 的大部分员工后,于去年加入微软。他此前还是 Google LLC 的 DeepMind 机器学习研究组的联合创始人。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。