英伟达正在掀起一轮交易热潮:在承诺对英特尔投资50亿美元以及对OpenAI投资1000亿美元之后,这家GPU制造商现在与中国的阿里巴巴达成了合作伙伴关系。
阿里巴巴周三宣布,将在其云AI平台中集成英伟达面向机器人技术、自动驾驶汽车和互联空间的AI开发工具。这家中国电商巨头将提供英伟达的物理AI软件栈,该软件栈能够构建真实环境的3D复制品,生成合成数据来训练用于机器人技术、自动驾驶车辆或工厂和仓库等智能空间的AI模型。
双方未透露交易的财务条款,但这标志着一项重要合作,将世界领先的AI模型训练专用芯片开发商与主要的云服务和AI模型开发商结合在一起。
这项交易正值阿里巴巴专注于在其主要电商业务基础上进一步发展AI业务。该公司周三表示,正在将AI技术支出提升至之前500亿美元预算之上,并概述了在巴西、法国和荷兰推出首批数据中心的计划。公司还在更多国家建设更多数据中心,将其数据中心覆盖范围扩展至全球29个地区的91个位置。
阿里巴巴周三还发布了其通义千问大语言模型系列的最新版本——通义千问3-Max。该公司声称这一模型是其"迄今为止规模最大、能力最强的模型",基于1万亿参数训练,非常适合编程和智能体应用。
Q&A
Q1:英伟达和阿里巴巴这次合作的主要内容是什么?
A:阿里巴巴将在其云AI平台中集成英伟达的物理AI开发工具,包括面向机器人技术、自动驾驶汽车和互联空间的AI开发工具。英伟达提供的物理AI软件栈能够构建真实环境的3D复制品,生成合成数据来训练AI模型。
Q2:阿里巴巴在AI业务方面有什么新动作?
A:阿里巴巴正在将AI技术支出提升至之前500亿美元预算之上,计划在巴西、法国和荷兰推出首批数据中心,并在更多国家建设数据中心。同时发布了通义千问3-Max大语言模型,基于1万亿参数训练。
Q3:通义千问3-Max有什么特点?
A:通义千问3-Max是阿里巴巴声称的"迄今为止规模最大、能力最强的模型",基于1万亿参数训练,特别适合编程和智能体应用场景。
好文章,需要你的鼓励
AI初创公司Modular完成2.5亿美元C轮融资,估值达16亿美元。该公司提供统一平台,让开发者无需重写代码即可在不同芯片上运行AI应用,包括CPU、GPU、ASIC和定制芯片。公司旨在打破英伟达CUDA的垄断局面,为企业提供更多硬件选择自由。其平台已支持英伟达、AMD和苹果架构,在新一代加速器上性能提升20%-50%。
OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。
谷歌发布Data Commons模型上下文协议服务器,为AI开发者提供标准化访问公共数据集的新工具。该服务器连接谷歌2018年推出的开放知识库Data Commons,整合经济、健康、人口和环境等领域的公共数据集。通过标准化接口,AI系统可直接查询数据而无需管理复杂API,有效减少模型幻觉问题,为构建数据驱动的智能体应用奠定基础,提升AI输出的准确性和可信度。
字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。