微软于周一宣布,其 Copilot AI 助手迎来了重大升级,集成了 OpenAI 的 GPT-4o 模型,从而支持高级图像生成能力。此次更新让用户只需用文字描述所需图像,即可在 Microsoft 365 应用(包括 Word、Excel 和 Outlook)内直接创建精细化的视觉效果。
另见: Microsoft 告别 Skype:这款标志性应用在推出 23 年后正式关闭
Copilot 是什么?
Microsoft Copilot 是集成于 Microsoft 365 应用(如 Word、Excel、PowerPoint、Outlook 和 Teams)中的 AI 助手。
借助 GPT-4o 等大语言模型,Copilot 能够起草文档、分析数据、制作演示文稿以及管理电子邮件和会议。此次更新使得 Copilot 现在也能根据文字描述生成图像。
我可以用 Copilot 的 AI 图像生成功能做什么?
集成了 OpenAI 最新的 AI 模型 GPT-4o 后,Copilot 能够将文本描述转换为高质量、逼真的照片级图像,大大扩展了用户在视觉内容上的应用范围。用户可以无需借助外部设计工具,就生成定制的图形、插图和设计作品。用户还可以修改现有视觉内容、应用样式转换,并在图像中生成清晰可辨的文本。
微软最初于上个月通过 Microsoft 365 Copilot 向企业用户逐步推出了这些 GPT-4o 图像生成工具。如今,同样的功能也通过面向消费者的 Microsoft Copilot 推向了大众市场。
另见: OpenAI 推出全新 GPT-4.1 模型,本月末将停用 GPT-4
这一步骤使 Microsoft Copilot 超越了诸如 Microsoft Designer 和 Image Creator 等其他创意工具,这些工具仍依赖于 OpenAI 较旧的 DALL-E 模型。相比之下,GPT-4o 代表了 AI 图像生成的尖端技术,具备更快的响应速度和更精细的输出效果。
通过这些增强功能,微软正致力于将 Copilot 打造成一款全面的 AI 助手,以在市场上与 OpenAI 和 Google Gemini 等重量级竞争对手抗衡。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。