微软发布三款基础AI模型挑战OpenAI与谷歌

微软AI研究实验室发布三款新的基础AI模型，可生成文本、语音和图像。MAI-Transcribe-1支持25种语言语音转文本，速度比Azure Fast快2.5倍；MAI-Voice-1可在一秒内生成60秒音频并支持自定义语音；MAI-Image-2为视频生成模型。这些模型由CEO穆斯塔法·苏莱曼领导的超级智能团队开发，定价相比谷歌和OpenAI更具竞争力，体现了微软在多模态AI领域的持续布局。

微软人工智能研究实验室周四宣布发布三款基础AI模型，能够生成文本、语音和图像内容。

此次发布标志着微软继续推进构建自有多模态AI模型体系，与竞争对手AI实验室展开竞争，尽管该公司仍与OpenAI保持紧密合作关系。

据公司新闻稿显示，MAI-Transcribe-1能够将25种不同语言的语音转录为文本，速度比微软Azure Fast服务快2.5倍。MAI-Voice-1是一个音频生成模型，用户可以在一秒钟内生成60秒的音频内容，并支持创建定制语音。MAI-Image-2是一个视频生成模型。

MAI-Image-2最初于3月19日在MAI Playground（一个新的大语言模型测试软件）上发布。现在，三款模型都在Microsoft Foundry平台上发布，转录和语音模型也可在MAI Playground中使用。

这些模型由微软MAI超级智能团队开发，该AI研究团队由微软AI首席执行官穆斯塔法·苏莱曼领导，于2025年11月成立并宣布。

"在微软AI，我们正在构建人文主义AI。我们在创建AI模型时有独特的视角——以人类为中心，优化人们的实际沟通方式，针对实际应用进行训练，"苏莱曼在博客文章中写道。"你们将很快在Foundry平台和微软产品体验中看到我们更多的模型。"

在日益拥挤的大语言模型市场中，MAI希望这些模型的卖点是比谷歌和OpenAI的模型更便宜，公司在博客文章中写道。

MAI-Transcribe-1起价为每小时0.36美元。MAI-Voice-1起价为每100万字符22美元，MAI-Image-2文本输入起价为每100万Token 5美元，图像输出为每100万Token 33美元。

尽管发布了自有模型，苏莱曼在接受VentureBeat采访时重申了微软对与OpenAI合作关系的承诺——尽管苏莱曼告诉The Verge，最近对该合作关系的重新谈判让微软能够真正推进这项超级智能研究。

微软已向这家AI研究实验室投资超过130亿美元，并通过多年合作关系在其各种产品中托管其模型。微软在芯片方面也采取同样立场：既生产自有产品，也从外部供应商采购。

Q&A

Q1：微软新发布的三款AI模型分别有什么功能？

A：MAI-Transcribe-1能够将25种不同语言的语音转录为文本，速度比微软Azure Fast服务快2.5倍；MAI-Voice-1是音频生成模型，用户可以在一秒钟内生成60秒音频并创建定制语音；MAI-Image-2是视频生成模型。

Q2：微软这些新AI模型的价格如何？

A：MAI-Transcribe-1起价为每小时0.36美元，MAI-Voice-1起价为每100万字符22美元，MAI-Image-2文本输入起价为每100万Token 5美元，图像输出为每100万Token 33美元，定价相比谷歌和OpenAI更具竞争优势。

Q3：微软发布自有AI模型后还会继续与OpenAI合作吗？

A：会继续合作。苏莱曼重申了微软对与OpenAI合作关系的承诺，微软已向OpenAI投资超过130亿美元。最近重新谈判的合作关系让微软既能推进自有超级智能研究，又保持与OpenAI的多年合作伙伴关系。

来源：Techcrunch

0赞

好文章，需要你的鼓励

微软发布三款基础AI模型挑战OpenAI与谷歌

来源：Techcrunch

2026

04/03

12:14

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

仅用语音和鼠标开发两款应用：IDE是否已成历史？

谷歌Gemma 4开源模型正式发布，手机也能运行强大本地AI

Oracle大规模裁员：AI替代人力成主要原因

泄露事件曝光Anthropic"Mythos"：专门针对网络安全的强大AI模型

微软为Copilot研究智能体增加多模型AI功能，提升准确性

Gemma 4：最强开放模型重磅发布，性能密度创新高

NVIDIA加速Gemma 4本地智能体AI：从RTX到Spark全面优化

微软发布三款高速图像语音AI模型

微软发布三款AI模型，与OpenAI展开直接竞争

Google发布Gemma 4对抗中国开源模型

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会