5月21日凌晨,微软发布了Copilot+ PC,这是全球首个专为AI设计的Windows PC,也是Windows史上最强版本。
据悉,Copilot+ PC内置了OpenAI的GPT-4o模型并搭载了超强芯片,每秒能执行40多万亿次操作。可提供实时的语音、语言翻译,实时绘画、文本、图片生成等一系列超强创新功能。
Recall是该产品的一大特色功能,可以帮助用户搜索、查看过去做过的任何事情,例如,用户在PC上打开了哪些应用,使用了哪些文档等。
可以像人的大脑一样记住所有见过、碰过的东西。为了安全性,用户可以手动删除这些操作镜像。

超强的Recall回忆功能
数据爆炸时代,我们每天在电脑上做的事情实在太多,浏览了无数的网页,存储海量的文件夹,从数千封邮件中找出自己最想要的那一个,这些琐碎的小事相当费时间。
现在,通过Recall功能可以将自己过去的所有操作,例如,浏览网站、打开应用、查看的邮件、打开的Office等,皆支持实现可视化搜索。

用户可以通过自然文本来搜索这些记录,就像电脑里的那个文件搜索框一样,Recall便会把你所有的操作罗列出来。
为了安全性和数据隐私,用户可以暂停Recall功能,同时所有镜像操作都存储在本地,随时可以手动删除不会上传到云端。
内置文生图功能
自微软发布文生图产品Image Creator以来,全球用户已经生成了超过100亿张图片。但在网页端使用,会出现延迟长、数据隐私泄露等问题。
现在,Copilot+ PC内置了功能强消耗低的大模型,帮助用户可以在本地PC直接使用文生图模型,同时重塑了内置的画图工具。
用户可以无限量地重新设计图片,例如,上传一张泰迪狗的照片,用文本提示让大模型帮你重新设计。

也可以在画图工具中实时将线条变成图片,这对于设计人员以及绘画爱好者来说帮助是巨大的。
值得一提的是,所有图片生成、设计都是无限量的,再也不用怕额度不够了。
实时字幕、语音翻译
我们在实时观看不同国家球赛、演出以及和跨国客户交流时,翻译是必不可少的工具。但传统的翻译工具只支持主流语言,对于那些极少语音支持较差,同时也无法做到实时翻译。
现在,Copilot+ PC提供的实时翻译功能,可将电脑的任何音频翻译为英语字幕,并在所有应用程序的屏幕上持续实时显示。
用户也可以将任何应用程序实时视频语音或预先录制的音频,从40多种语言即时、自动地翻译成英文字幕,即便不联网离线状态也能完成。
该功能对于跨国商务、学术交流等有着巨大帮助,帮助人们消除语言障碍更好地进行实时聊天。
增强Adobe全家桶
微软与Adobe达成了技术合作,其旗舰应用Photoshop、Lightroom、Illustrator、Premiere Pro等都将可以在Copilot+ PC使用。
微软也会针对Adobe新推出的生成式AI功能,例如,使用 DaVinci Resolve Studio中的NPU加速的Magic Mask,轻松地将视觉效果应用于物体和人物,在芯片、硬件层面进行大幅度优化增强其性能和响应效率。

使用CapCut 中NPU上运行的自动剪切功能,快速删除任何视频剪辑中的背景。

更快、更好的Copilot
随着ChatGPT的功能不断完善,已经成为我们日常办公、学习不可缺少的工具。为了进一步提升文本生成和响应效率,Copilot+ PC内置了OpenAI最新发布的大模型GPT-4o。
与网页端相比,本地的Copilot响应效率更高,用户可以向其询问任何内容,例如,安排旅行计划、电影推荐、文案扩写、文本翻译等。

此外,对PDF、PPT、Word等文档的总结能力也更加便捷,可以随时为用户解读冗长、繁琐的内容。

目前,联想、宏碁、华硕、戴尔、惠普和三星著名PC厂商已经与微软签订了合作协议,6月18日将正式发布不同型号的Copilot+ PC。
微软表示,Copilot+ PC只是刚开始,他们会通过生成式AI重塑整个PC生态,从底层硬件、芯片再到开发、软件应用层等,这将是Windows平台诞生至今几十年最重要的技术变革。
好文章,需要你的鼓励
尽管2026年智能手机外观可能变化不大,但内部技术正发生飞跃式进步。AI原生处理器、新型连接技术和先进显示系统正将日常设备转变为具备企业级功能的强大个人平台。这些趋势对企业和消费者同样重要,因为人们携带的手机决定了他们如何访问数据、协作办公、管理工作流程和使用数字服务。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
《时代》杂志宣布AI及其架构师为2025年度人物,包括扎克伯格、苏姿丰、马斯克等八位科技领袖。编辑认为今年是AI全面潜力显现的关键年份,这项技术加速了医学研究和生产力提升,让不可能变为可能。从企业高管到教师学生,所有人都在思考AI对生活的颠覆性影响。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。