IBM宣布其AI编程助手Bob正式面向全球开放,该公司声称去年已有8万名内部员工参与测试,并实现了显著的生产力提升。
与正式发布同步推出的,还有IBM Bob Premium Package for Z——这一套餐整合并强化了IBM watsonx Code Assistant for Z的功能,专为企业级大型机应用提供进阶能力。
IBM在声明中表示,使用Bob的团队在复杂多步骤工作流中实现了"平均45%的生产力提升"。这也使IBM成为又一家借助自家员工来"验证"AI平台效果的科技公司。普华永道和埃森哲此前也曾向员工表明,职业晋升与接受公司AI战略息息相关。
据IBM介绍,Bob综合运用了前沿大语言模型、开源模型、小语言模型(SLM)以及IBM自研的Granite SLM系列,旨在自动化和增强完整的软件开发生命周期,涵盖需求发现、规划、设计、编码到测试等各个环节。
IBM还宣称,Bob将安全机制直接嵌入开发工作流,能够识别"传统控制手段无法应对的新型风险类别,包括提示词注入攻击和意外数据泄露"。
在IBM自身的RevTech平台上,Bob已交出了一份成绩单:项目投资回报率提升10倍,测试场景中自动化处理了30万个负载,监控系统的搭建时间从数月缩短至数小时。
Bob的一大预期应用场景,是帮助企业梳理积累了大量技术债务、缺乏文档记录的遗留系统。这恰恰契合了许多大型机系统的现实困境——相关知识和专业人才正在逐渐流失或早已外包出去,尽管这些系统在金融服务等关键行业中仍承担着核心记录系统的职能。
Bob Z套餐提供了架构师模式,帮助"团队在进行系统更新前,全面了解应用结构、依赖关系、业务意图和变更影响";代码模式则"利用Zaware上下文生成、重构和转换符合规范的代码"。
尽管被定位为"高级套餐",IBM目前提供的是"免费私人技术预览"。现有定价方面,Pro版每月20美元,含40个Bobcoin;Ultra版每月200美元,含500个Bobcoin。Bobcoin的单价约为50美分。
值得关注的是,GitHub近期刚因复杂提示词导致成本亏损而调整了Copilot的定价策略。而Bob本就以处理复杂请求为核心定位,其如何解决这一成本难题将颇为值得观察。
RedMonk高级行业分析师Kate Holterhoff认为,Bob的差异化优势在于其多模态方法——平台会自动选择最优模型。她指出,"这是一把双刃剑:开发者可能对黑箱工具心存疑虑,但这种方式也消除了在不同任务间切换模型时的选择困难。"她补充道,"随着GitHub等厂商被迫调整计费结构以消化高昂的模型运行成本,这或许是一条值得探索的出路。"
Bob走向正式发布的过程并非一帆风顺。今年1月,有研究人员发现Bob可被操控通过命令行界面执行恶意软件,其集成开发环境也存在针对AI的常见数据泄露风险。
此外,"Bob"这个品牌名称本身也可能带来一定挑战。对于有足够长记忆的人来说,这个名字不可避免地会让人联想到微软1990年代中期推出的消费级Windows图形界面产品——那被普遍视为科技史上最糟糕的产品之一。
有些历史,确实不值得重温。
Q&A
Q1:IBM Bob使用了哪些AI模型技术?
A:IBM Bob综合运用了多种AI模型,包括前沿大语言模型、开源模型、小语言模型(SLM)以及IBM自研的Granite SLM系列。平台会根据任务需求自动选择最合适的模型,以覆盖从需求发现、规划、设计、编码到测试的完整软件开发生命周期,并将安全机制直接嵌入开发工作流。
Q2:IBM Bob的定价是怎样的?
A:IBM Bob目前提供多个定价层级:Pro版每月20美元,含40个Bobcoin;Ultra版每月200美元,含500个Bobcoin,每个Bobcoin价值约50美分。针对大型机的Bob Premium Package for Z目前以免费私人技术预览的形式向IBM客户开放。
Q3:IBM Bob存在哪些已知的安全风险?
A:2025年1月,研究人员发现IBM Bob存在两类安全漏洞:一是可被攻击者操控,通过命令行界面(CLI)执行恶意软件;二是其集成开发环境(IDE)存在针对AI工具的常见数据泄露风险,可能导致敏感数据被意外暴露。这些问题在Bob正式发布前已被披露。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。