在成立一周年之际,零一万物公开了开源闭源双轨大模型的战略布局,正式发布了千亿参数Yi-Large闭源模型,并将早先发布的Yi-34B、Yi-9B/6B中小尺寸开源模型版本升级为Yi-1.5系列,每个版本达到同尺寸中SOTA性能最佳。
同时,零一万物本月同步官宣了从应用到生态的产品线:2C生产力应用“万知”正式提供服务、赋能2B生态的“API 开放平台”全球上线。
零一万物CEO李开复博士在活动上表示,零一万物要做一个不一样的全球化大模型公司,所有模型的价值必须体现为用户价值,零一万物重视用户体验,持续优化产品,打造多样化的产品矩阵。“既然要让全世界的人都能用到这个模型,肯定要开源、闭源,还要面向2B、2C。”
开源闭源双轨大模型
谈到大模型,我们就不得不说闭源与开源,而零一万物则采用“两条腿”走路。
千亿参数规模的Yi-Large在第三方权威评测中表现出色。最新出炉的斯坦福评测机构AlpacaEval 2.0经官方认证的模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度) 排到了世界第二,仅次于 GPT-4 Turbo,Win Rate更排到了世界第一。
不止于此,零一万物已启动下一代Yi-XLarge MoE模型训练,将冲击GPT-5的性能与创新性。
同时,零一万物Yi系列开源模型也迎来全面升级,Yi-1.5分为34B、9B、6B三个版本,且提供了Yi-1.5-Chat微调模型可供开发者选择。
以开源模型构建生态,以闭源模型展开AI-First探索,开源闭源双轨模型策略使得零一万物构建起了生态体系。
零一万物面向国内市场一次性发布了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform英文站同步对全球开发者开放试用申请。
零一万物API平台负责人蓝雨川表示,作为标准化产品的API复用性更强,商业模式也更趋近于云服务。比起AI 1.0定制化重交付的模式,API能够更快穿透千行百业。
“我们既追求最高的性能,又追求很好的性价比,这是零一万物API的一个特色。”李开复说。
寻找TC-PMF,实现AI应用的爆发
在移动互联网的鼎盛时期,PMF(Product-Market Fit,产品市场契合)曾是众多初创企业追求的核心目标。然而,随着大语言模型成为新的创业焦点,仅仅追求产品与市场契合远远不够。
李开复博士认为,PMF这一概念已经不能完整定义以大模型为基础的AI-First创业,应当引入Technology(技术)与 Cost(成本)组成四维概念——TC-PMF。国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到 “TC-PMF”(Product-Market-Technology-Cost Fit,技术成本 X 产品市场契合度),开发出最好的AI-First应用。
零一万物在海外率先验证了TC-PMF,去年9月开始,零一万物便聚焦生产力、社交赛道于海外应用展开探索,已有4款产品陆续上线。目前零一万物海外生产力应用总用户接近千万,营收今年预期过亿人民币。
模基共建与模应一体
作为TC-PMF方法论的落地,零一万物秉持模基共建与模应一体的策略。
模基共建中的“基”是指AI Infra(AI Infrastructure 人工智能基础架构技术),其主要涵盖大模型训练和部署提供各种底层技术设施,在李开复博士看来,自研AI Infra是零一万物必然要走过的路,零一万物也自成立起便将AI Infra设立为重要方向。
零一万物模型训练负责人黄文灝补充说,零一万物着力于实现计算效率的优化,这里面最重要的是对数据的计算效率。算法和Infra要一体优化,最后直接并成一个团队。
“我们模型和Infra团队基本是1比1的规模,特别重视AI Infra,它给我们带来绝对的成本优势,不断降低训练和推理成本。”李开复说。
据了解,零一万物Yi-Large训练环节的平均MFU(Model Flops Utilization,模型算力利用率)已显著超越业内平均水平。多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。
无论是2C还是2B,“模应一体”的思路始终贯穿零一万物的商业实践——模型团队与产品团队紧密结合,摸清模型能力边界,针对某一应用场景去优化专有模型。
零一万物生产力产品负责人曹大鹏表示,大模型带来交互式的变革,可以输入一个问题或一个需求就可以开启你的工作。“万知”重构了工作流程,所有工作流都是从一个对话开始。
结语
随着大模型的纵深发展,零一万物采用新的打法,结合模型、Infra、应用三位一体的优势,走向未来AI的普惠点,人人受益。
好文章,需要你的鼓励
串流技术正打破传统游戏边界,让"即点即玩"的畅快体验触手可及,不仅重塑了玩家的游戏方式,更将引领整个产业迈向云端加速迈进。
高通宣布收购越南 AI 研究公司 VinAI 的生成式 AI 部门,金额未披露。这标志着高通持续扩张 AI 工具领域。VinAI 由前 DeepMind 研究科学家 Hung Bui 创立,开发多种生成式 AI 技术。此次收购将增强高通在 AI 解决方案方面的能力,有望为多个行业和消费者带来创新。
GameForge AI 是一款基于人工智能的游戏开发平台,可帮助用户轻松创建自己的游戏世界。本文介绍了 GameForge AI 的功能和使用方法,包括创建角色、场景和任务等。虽然 AI 生成速度较慢,但平台对游戏设计师、桌游爱好者和学生等用户都很有吸引力。与其他 AI 创作工具相比,GameForge AI 更注重构建复杂的叙事驱动型世界。
Anthropic 推出面向高等教育的 Claude for Education 计划,与 OpenAI 的 ChatGPT Edu 计划形成竞争。该计划为学生、教职员工提供 AI 聊天机器人 Claude 的访问权限,并增加了一些新功能。新功能包括"学习模式",旨在培养学生的批判性思维能力。Anthropic 已与多所大学达成合作,希望通过这一计划扩大在教育领域的影响力。