苹果在今天凌晨1点举办的产品发布会上宣布,将最新开发的 “Apple Intelligence”集成在iPhone 16、iPad 平板和Mac笔记本中,全面拥抱生成式AI。
其中,Siri已经集成了OpenAI的ChatGPT(GPT-4o)功能,使其理解、生成、执行能力更强,例如,你在计划一次旅行时,想要了解目的地的景点推荐、美食特色、文化等,Siri 可以通过 ChatGPT 获取丰富的信息更好的帮助你。
此外在图片、文档、应用等产品中也集成了大量Apple Intelligence功能。下面「AIGC开放社区」就为大家详细介绍一下本次发布会上,与生成式AI相关的主要内容。

Siri支持ChatGPT
本次Siri在iPhone 16、iPad 、Mac中获得了重大升级,用户通过 ChatGPT、GPT-4o 提供的多模态语音推理功能,能轻松理解电子邮件、消息、照片、日历事件、文件等,并能轻松回答、执行与这些相关的问题。
例如,可以通过语音询问,上周三我去看的那部电影叫什么名字;在填写表格时说 “在此处添加我的护照号码”,Siri 都能快速帮你完成。

Siri的屏幕感知功能也得到了加强,可以识别屏幕上的内容并采取相关的行动。例如,当用户收到推荐新咖啡店的短信时,Siri可以理解上下文并提供步行到达咖啡店的预计时间。
Siri的多模态推理功能,现在能够更好地处理用户在说话时的犹豫和更改,即便用户在发出指令时改变主意,Siri也能够理解并执行正确的操作,这在以前却很难做到。
持续记忆对话上下文是Siri的另一个亮点,能够记住用户在近期请求中的对话内容,这样用户就可以更自然地继续对话,而不需要重复上下文。Siri还通过访问大量语言模型训练的苹果支持文档,扩展了其产品知识库,能够回答关于苹果产品特性和设置的数千个问题。
在视觉反馈方面,Siri现在在与用户对话时,手机屏幕边缘会显示优雅的发光效果,不仅能响应用户的声音,还允许用户在与Siri交流时继续滚动、打字或导航设备。此外,用户现在可以通过文本与Siri交流,Siri键盘提供预测文本功能,极大提升了Siri的使用体验。
Image Playground
Image Playground这个新应用为用户提供了更好的图像体验,轻松创建新图像、访问以前创建的图像、重新混合以前的图像,并使用喜欢的社交和通信应用与朋友和家人分享创作等。
例如,你可以根据主题、服装、配饰和地点等来生成图片,也可以根据照片库中人物的理解,合成一些匪夷所思有趣的图像。

苹果对照片功能中的“回忆”功能也进行了优化,现在,你通过自然语言就能搜索特定的照片,例如,帮我查找一下2019年10月的某一张照片。这对于那些拥有数千甚至上万张图片的用户来说非常有用。
也可以使用内置的AI功能,清除特定的区域而不会影响整个图像的质量。例如,你在风景区拍照时经常会出现其他人的身影,通过该功能就能轻松去除。
在邮件和信息中使用生成式AI
苹果在邮件和信息中集成了Apple Intelligence,帮助用户提升沟通效率节省大量时间。邮件应用引入了优先消息功能,它能够根据紧迫性自动将最重要的邮件置于收件箱的顶部,让用户能够立即注意到并处理最相关的消息。
预览摘要功能为用户提供了在打开邮件之前快速了解邮件内容的便捷方式,邮件预览不再只是显示邮件的前几行文字,而是提供了更全面的摘要信息。
对于长邮件,邮件应用提供了线程摘要功能,用户只需轻点一下,就可以看到整个邮件线程的详细摘要,使得理解长篇邮件或一系列相关邮件变得更加容易。智能回复功能基于邮件内容为用户提供快速回复的选项,这些选项能够添加细节,例如,回答邮件中提出的特定问题,使得回复邮件更加快捷和准确。
信息应用在预测栏中,可为用户提供了基于对话内容的生成回复选项。用户在回复消息时,可以迅速选择系统提供的、与上下文相关的回复建议。信息应用中的消息摘要预览功能,使得用户在对话列表中就能看到消息的简要摘要,而不必打开整个聊天。
同时引入了新的笔记转录摘要功能,可以从音频记录中智能创建关键点摘要,帮助用户无需完整听取录音就能快速了解内容。图像魔杖工具允许用户从笔记中选择绘图并将其转换为图像。
文本写作功能
在Apple Intelligence加持下,用户可以使用类似的ChatGPT来完成多种文档写作了。文本重写功能允许用户创建文本的多个版本,同时保持原有的语调。用户可以轻松地尝试不同的表达方式,选择最符合需求的版本。
该功能特别适合需要对文本进行微调的用户,无论是为了改进表达的清晰度还是为了适应不同的读者群体。
风格重写功能可以根据用户的需要,调整文本的风格,例如,将其改写成“专业”、“简洁”或“友好”的文本样式。这对于那些需要根据不同场景写作风格的用户来说非常有用,例如,将一篇随意的博文改写成一份正式的报告。

摘要功能则可以帮助用户将任意长文本内容并生成高质量的摘要。无论是文档、文章还是通信内容,这项功能都能帮助用户快速抓住要点,节省阅读和理解的时间。
目前,苹果的上述等功能将在下个月的iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1系统中推出。未来,苹果会持续推出相关的生成式AI功能,重塑产品矩阵提供更好的AI体验。
好文章,需要你的鼓励
谷歌地图将集成Gemini人工智能技术,旨在将其升级为一个"全知型副驾驶"助手。这一整合将大幅提升地图服务的智能化水平,为用户提供更加个性化和全面的导航体验。通过AI技术的加持,谷歌地图有望在路线规划、地点推荐和实时信息服务等方面实现重大突破。
这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。
微软研究人员发布新的仿真环境来测试AI智能体,研究显示当前智能体模型容易受到操纵。该名为"Magentic Marketplace"的合成平台让客户智能体与商家智能体进行交互实验。测试包括GPT-4o、GPT-5和Gemini-2.5-Flash等模型,发现智能体在面临过多选择时效率下降,且在协作方面表现不佳。研究揭示了AI智能体在无监督环境下的性能问题。
卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。