苹果的汽车项目历经十年,作为公司历史上最具雄心的项目之一,却以一场未解答任何疑问的简短12分钟会议落幕。
近日,据彭博社报道,苹果公司已决定终止其长达十年的汽车生产计划。此决定由公司首席运营官Jeff Williams和负责汽车项目的副总裁Kevin Lynch在本周二的内部会议上宣布。
据透露,部分原本在汽车项目组的员工将被重新调配至由John Giannandrea领导的机器学习和人工智能部门,参与生成式AI项目。
至于原本专注于汽车硬件和车辆工程的数百名员工,可能会面临裁员的风险。
值得注意的是,苹果汽车团队规模庞大,近2000名员工。这些员工将有可能被转至公司的AI部门。
这一决策与苹果公司一贯的[产品不惊艳,宁死不推出]的理念相符。
苹果在2014年左右开启了泰坦计划,目标是打造一款拥有豪华内饰和语音导航功能的全自动电动轿车。
但这个项目几乎从一开始就陷入困境,苹果多次更换了团队的领导和战略。
几年前,道格-菲尔德离职后,林奇和威廉姆斯开始负责这项工作。
该公司曾经放弃过一些项目,包括在2015年左右放弃的电视机生产计划。
但很少有项目能持续如此之久,涉及如此之多的员工,或耗资数十亿美元。
早在2017年,苹果的造车项目[泰坦计划]就已经被曝失败,原因是高层无法就造车目标达成一致。
曾在特斯拉公司工作过的苹果老员工道格·菲尔德曾于2018年重返苹果试图接管[泰坦项目]。
但项目进展非常不顺利,2019年,苹果解雇了团队中近200名员工。
此外,苹果公司还计划对其CarPlay软件进行升级,并计划将其推广至更多车型。
这一决策可能有两层含义:
①苹果可能将重点转向AI领域,投入大量资源进行研发。
②通过升级CarPlay软件并推广至更多车型,苹果似乎并未完全放弃汽车业务,而是采取了一种与华为类似的[造车]策略。
苹果目前已将更多资源聚焦于AI项目,这预示着未来两三年内iPhone将有可能迎来重要的更新。
值得一提的是,苹果正计划为iOS 18进行重大升级,有望成为iPhone历史上最具影响力的软件更新。
据预测,iOS 18将采用生成式AI技术,以提升Siri和Messages应用程序在问答和自动补全句子方面的能力。
此外,苹果在生成式AI领域动作频频,不仅发表了多篇具有影响力的论文,还积极与主要新闻出版商洽谈,以获取内容许可并协助开发AI系统。
最近,据Macrumors报道,苹果公司正在内部测试一款类似于ChatGPT的生成式AI工具[Ask],旨在帮助AppleCare客服更有效地回答用户的问题。
近期,苹果在技术创新方面成果显著,包括HUGS、MGIE以及本月的Keyframer等,为用户带来全新的数字体验。此外,苹果内部正在测试问答工具Ask,进一步丰富了其技术生态。
苹果CEO蒂姆·库克在最近的公司财报会议上透露,苹果将在今年公布新的AI功能,标志着公司在人工智能领域的布局正逐步深化。
2023年夏季,有消息指出苹果正致力于开发对标ChatGPT的AppleGPT。
随后,彭博社报道苹果构建了自有的大语言模型Ajax,并推出内部聊天机器人AppleGPT进行测试。
年底前,更有消息称苹果正与大型出版商商讨授权事宜,以利用授权素材优化模型训练。
面对财报会议上的提问,库克坦承苹果在AIGC方面有所规划并已进行大量投资。
在2月初的财报会议上,他进一步强调AI是苹果的重要投资领域,并预告公司将于今年晚些时候公布AI方面的最新进展。
在产品层面,苹果正积极试验将AI技术融入Siri、生成视频和图像的软件以及多模式人工智能技术等。
业界传闻,苹果计划将AI技术广泛应用于其众多应用程序中,如Apple Music、Xcode、Pages、Keynote和AppleCare等,为用户提供更为智能和便捷的服务。
苹果放弃造车,很可能只是暂时延缓造车计划,等待自动驾驶技术突破后再推出更为成熟的无人驾驶汽车产品。
部分资料参考:字母榜:《Sora[杀死]苹果汽车》,冰川思享号:《苹果不造车,雷军们比库克还着急》,凤凰网科技:《库克冒进白烧700多亿 不愿收购特斯拉》,甲子光年:《苹果放弃造车,转向人工智能》,虎嗅APP:《放弃造车背后:苹果AI底气何在?》
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。