OpenAI(即 ChatGPT 聊天机器人的开发公司)正在开发一个新的 AI 模型。根据 CEO Sam Altman 周一在推特上的透露,这将是一个具有推理能力的"开放权重"语言模型。
"开放权重" AI 模型是介于开源和闭源方法之间的一种中间形态。权重是 AI 模型学习和建立连接的方式——某些特征或连接会被赋予更高的权重,以强化特定信息。根据联邦贸易委员会的说法,开放权重模型意味着其权重是公开可用的。这表示用户可以查看这些权重并进行修改,而无需用新数据重新训练模型。
开放权重模型通常能降低企业的使用成本,并允许他们对模型进行定制。例如,企业可以将其内部文档上传到现有的开放权重模型中,在不必从头开始构建的情况下,将这些信息整合到模型的输出结果中。
但开放权重模型与开源模型并不相同。顾名思义,开源模型允许你查看其源代码组成,有时还包括其训练和权重分配方式。在开放权重模型中,你可以看到模型如何建立连接,但不一定能看到其底层代码或训练内容。这完全取决于开放程度。考虑到 OpenAI 一向不披露 ChatGPT 训练数据的做法,这个新的开放权重模型可能只会让人们稍微窥见其运作方式,而不会展示更多内容。
AI 公司正在激烈竞争,各自开发适用于不同用途的各类模型。OpenAI 的新模型有望成为 Meta 开源 Llama 模型的竞争对手。Mark Zuckerberg 多次表示,开源是 AI 发展的正确道路。新模型的推出也正值中国 AI 企业如 DeepSeek 争夺领先地位之际。据报道,DeepSeek 最新的 V3 模型目前处于领先地位,它也是一个开放权重模型。开放权重和开源模型可能会通过提供更便宜、更定制化的 AI 工具来威胁 OpenAI 的订阅模式,因此该公司似乎正在采取行动追赶竞争对手。
目前尚不清楚新模型具体何时发布。现在,OpenAI 正邀请开发者提交反馈,说明什么样的模型功能对他们最有用。你可以通过 OpenAI 网站上的表单提供反馈。
如需了解更多信息,可以查看使用 ChatGPT 新图像生成器制作的吉卜力风格 AI 图像,以及我们对该聊天机器人的完整评测。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。