苹果在2026年全球开发者大会上大力推进AI与Siri的相关布局,正如外界此前的预期。此次发布的Apple Intelligence与Siri AI新功能颇具吸引力。坦白说,笔者此前对AI真正融入日常生活并不抱太大期望。一场又一场的发布会,台上抛出的AI功能往往与实际需求相去甚远。
诚然,AI可以根据提示词生成视频,手机也能通过语音指令叫车,但这类功能在实际使用中意义有限。本以为此次WWDC 26又将是一场功能轰炸,没想到苹果这次把AI的产品逻辑讲对了——展示的功能贴近真实使用场景,让人产生了真切的共鸣。
举个例子,笔者一直希望能更便捷地在iPhone上添加快捷指令,也希望在后期编辑时能调整照片的构图方向。苹果并没有要求用户改变使用手机的方式,而是致力于简化用户本就在做的事情。
目前笔者已在iPhone Air上安装了iOS 27开发者测试版,对未来的正式版充满期待。虽然Siri AI仍处于排队等候阶段,但有四项功能已经让人迫不及待,希望能在今年晚些时候的正式版中体验。
空间重构让生成式AI用对了地方
苹果在"照片"应用中演示了一项名为"重构画面"(Reframe)的新功能,该功能借助空间照片技术对平面照片中的景深信息进行分析,允许用户在后期编辑中调整照片的构图角度。确定满意的新构图后,照片应用会通过生成式AI自动填充边缘区域。
作为一名摄影新手,笔者经常在回看照片时才意识到当时的构图不够理想。有时背景中出现干扰元素,不得不用"去除"或"对象橡皮擦"工具处理,但效果并非每次都自然。因此,能够在后期重新调整构图角度,是一个非常实用的想法。
相比将人物单独抠出再重新摆放位置,直接调整拍摄角度的方式让主体与背景之间的分离感不那么突兀。CNET高级撰稿人杰夫·卡尔森也指出,Adobe Lightroom等图像编辑软件同样支持整体画面平面调整,但代价是图像会出现畸变。相比之下,苹果的方案在实现调整的同时能保持照片原有分辨率。
用自然语言创建快捷指令
苹果的"快捷指令"应用是一款出色的自动化工具,支持跨数百款应用创建自定义命令和操作流程。然而上手过程并不轻松,尤其对不熟悉自动化逻辑的用户而言。笔者第一次尝试创建自动化任务时,折腾了几分钟便放弃了;再次尝试时,也花了约15分钟才摸清门道。
在iOS 27中,苹果借助Apple Intelligence让快捷指令的创建变得更加简单。用户只需用自然语言描述需求,系统便会自动完成搭建。
以苹果的演示为例:用户描述了自己的目标——每天下班后让伴侣知道自己到家的时间。系统随即创建了一条快捷指令:通过GPS检测用户离开公司的时间,利用地图计算回家的预计到达时间,再通过"信息"应用发送给伴侣。
笔者也有不少想创建的快捷指令:比如让妈妈每天早上8点到10点之间打开厨房智能插座时,自动开启智能音箱并播放晨间歌单;或者当妈妈找不到手机时(这几乎每天都会发生几次,她真的很可爱),只要收到笔者发送的"#lost"短信,手机便会自动大声播放音乐;还有家庭办公室的场景——离家时自动关闭灯光、充电插座和无线充电器。
更智能的浏览器
Safari将在苹果全系设备上迎来重大升级。虽然部分功能在macOS 27上可能更为实用,但有两项功能尤其令人期待:一是"通知我"(Notify Me),二是一键更新已泄露密码。
后者允许"密码"应用自动更新已泄露的密码。目前笔者的密码应用中积压了多条泄露提醒,却一直没有时间和精力逐一处理——一个个打开网站更新信息实在繁琐。涉及财务账户时还会立刻行动,但对于其他影响不大的网站,往往一拖再拖、最终遗忘。如果能在密码应用内一键完成所有泄露密码的更新,无疑是个实用的改进。
其次是"通知我"功能,它可以监控网页内容的变化。笔者热衷于寻找机票或心仪手表的优惠,目前已开启了Google快讯来追踪特定航线的价格。相比之下,苹果的"通知我"功能更为简洁,既能帮助发现更多优惠,又不会让邮件收件箱变得杂乱,用来监控股票投资组合的动态也颇为理想。
相机应用中的Siri模式
苹果在"相机"应用中新增了一个专属的Siri模式,并整合了视觉智能功能。笔者认为这将成为iOS 27中使用频率最高的功能。它允许用户基于周围的环境直接进行搜索、提问和执行操作,无需跳转至其他应用。旅行场景下的实用性尤为突出。
每次出行,笔者都需要借助Google Lens翻译外文菜单、用Gemini查询商品在本国的价格、再用Splitwise与同伴AA分账。新的Siri模式有望让这一切在相机应用内一站式完成,彻底告别多应用来回切换的烦恼。
此外,全新的Siri AI同样令人期待——它嵌入灵动岛,能够理解屏幕上的内容,实现情境感知。希望排队等候能早日结束!在那之前,笔者会继续尝试重构更多照片,发掘那些能让整体使用体验悄然升级的细节变化。
Q&A
Q1:苹果照片应用的Reframe功能和Lightroom的画面调整有什么区别?
A:Adobe Lightroom等软件支持对整张照片进行平面调整,但会导致图像产生畸变,影响画质。苹果的Reframe功能同样支持后期调整构图角度,但在应用生成式AI填充边缘内容的同时,能够保持照片的原有分辨率,避免了图像失真的问题,对于注重画质的用户来说更具优势。
Q2:iOS 27的快捷指令自然语言创建功能具体怎么用?
A:在iOS 27中,用户无需手动搭建自动化流程,只需用日常语言描述自己的需求,Apple Intelligence会自动理解意图并生成对应的快捷指令。例如,用户只需说"每天下班后告诉伴侣我的到家时间",系统便会自动调用GPS、地图和信息等应用,完成整条自动化流程的搭建,大幅降低了使用门槛。
Q3:Safari的"通知我"功能有哪些实际使用场景?
A:"通知我"功能可以监控指定网页的内容变化,并在发生更新时主动提醒用户。实际使用场景包括:追踪机票或商品价格变动、关注限量商品的库存更新、监控股票或基金相关页面的动态等。相比依赖Google快讯或手动反复查看网页,这一功能更加简洁直接,且不会产生额外的邮件通知,有效减少信息干扰。
好文章,需要你的鼓励
前沿AI研究机构Decart发布最新世界模型Oasis 3,旨在弥合虚拟仿真与物理AI之间的鸿沟。该模型将超写实交互图形能力与强大物理引擎相结合,可生成动作驱动的视频流,支持多视角环境模拟,延迟低于200毫秒。开发者能够借助自然语言提示,快速构建多样化极端场景,有效解决机器人和自动驾驶领域长期存在的"仿真到现实"差距问题,大幅降低物理AI训练成本。
OpenSkill是一套让AI代理无需人工监督即可自主成长的框架,通过从互联网获取知识、自建虚拟考题反复练习,实现真正的开放世界自我演化。
Visual Components正式发布5.1版本工厂仿真软件,重点引入高精度物理仿真与可扩展机器人协同调度能力,支持在同一环境中同时模拟数百台自主移动机器人、自动导引车及人员的运行状态。新版本还将仿真性能提升至前代的10倍,新增Allen-Bradley PLC支持及Nachi、Epson机器人虚拟调试插件,并将脚本环境升级至Python 3。该软件旨在帮助制造商在实际部署前完成系统验证,降低调试风险,缩短投产周期。
论文研究了AI评委同时优化多个评判维度时的两大失败原因:梯度稀释与指令干扰,为多目标提示词优化提供了系统性诊断框架。