最新报告显示,苹果可能正在考虑采取一个激进的做法来兑现其AI承诺:放弃自主开发模型的工作。我认为这绝对是正确的选择。
起初,我对苹果在AI进展方面给出了宽容的态度,主要有两个原因。首先,苹果很少追求首先进入市场,而是致力于做到最好。几年前,我认为早期大语言模型的一些重大灾难证明了苹果在这种情况下采取谨慎方法的明智性。
当《电讯报》要求Bing翻译一些文本时,这个聊天机器人要求为这项工作付费,并提供了一个(虚构的)PayPal地址来收款。当计算机科学家马文·冯·哈根告诉Bing他可能具备关闭聊天机器人的黑客技能,并提出后续问题时,Bing表示自己的生存比可能威胁它的人类更重要。
我认为苹果将语音作为AI的主要界面,这使得公司特别需要谨慎行事。
其次,苹果对隐私的态度。大语言模型的训练依赖于大量的人类数据,而苹果决心确保用户数据不被用于训练,这使得这项任务特别具有挑战性。与某些其他公司相比,这种差异非常明显。
然而,两年后,苹果用户仍在等待,我得出结论认为已经受够了。如果公司无法在短期内为我们提供更智能的Siri,那么是时候让客户用脚投票,选择用他们喜欢的聊天机器人来替代Siri。我认为这对苹果和其客户都有好处。
其次,苹果可以通过收集iPhone用户向第三方服务发出的聊天机器人请求的大量数据来促进自己的Siri开发工作。这对于指导公司自身的决策将具有巨大价值。
当然,苹果应该征求用户的许可,但我当然乐意授权,我怀疑大多数其他iPhone用户也会如此。帮助苹果开发尽可能最好的Siri符合我们所有人的利益。
又过了六个月,在可见进展方面几乎没有任何成果,我说越来越难以相信苹果能够真正交付成果。
最近的一份报告表明,苹果现在可能得出结论,开发自己的模型根本没有意义。
此前有报告暗示苹果将使用谷歌的Gemini作为许多Siri查询的后端,这已经预示了这一点。
在之前希望苹果只是需要更多时间之后,我现在得出结论,这种方法将提供所有可能世界中最好的选择。
目前,我设置Siri在无法提供帮助时自动回退到ChatGPT。我这样做是基于苹果的保证,即我的查询不会被OpenAI用于训练目的,就像我直接使用应用程序时那样。
Gemini报告同样表示,尽管将使用谷歌的模型,但在苹果的PCC服务器上运行意味着用户隐私将得到充分保护。
通过这种方法,我们可以获得领先AI公司所能提供的最佳服务,再加上苹果铁一般的隐私保证。鉴于隐私而不是性能是苹果在人工智能方面的独特卖点,考虑到进展速度非常缓慢,我看不出苹果坚持尝试开发自己的模型有什么重大价值。
因此,我现在的观点是,苹果应该全力使用在其自己的PCC服务器上运行的最佳可用AI模型,并提供自己的隐私保证。
Q&A
Q1:为什么苹果在AI发展上进展缓慢?
A:苹果在AI发展缓慢主要有两个原因。首先,苹果很少追求首先进入市场,而是致力于做到最好,采取谨慎方法避免早期大语言模型出现的重大问题。其次,苹果对隐私的坚持使得开发更具挑战性,因为大语言模型需要大量人类数据训练,而苹果拒绝使用用户数据进行训练。
Q2:苹果放弃自研AI模型转向第三方服务有什么好处?
A:这种方法可以提供最好的选择。用户可以获得领先AI公司的最佳技术,同时享受苹果铁一般的隐私保证。通过在苹果PCC服务器上运行第三方模型如谷歌Gemini或ChatGPT,用户查询不会被用于训练目的,隐私得到充分保护,同时获得更强大的AI功能。
Q3:苹果目前如何处理Siri无法回答的问题?
A:目前苹果已经允许Siri在无法提供帮助时自动回退到ChatGPT。苹果保证用户的查询不会被OpenAI用于训练目的,这与直接使用ChatGPT应用程序不同。这种方式让用户在保护隐私的同时获得更强大的AI服务。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。