人工智能初创公司aiOla推出基于流匹配训练技术的语音AI模型Drax,挑战OpenAI和阿里巴巴等巨头。该模型重新定义语音算法训练方式,能在嘈杂环境中准确识别语音,兼顾速度与准确性。相比OpenAI的Whisper和阿里巴巴Qwen2,Drax采用并行流处理技术,速度提升32倍,词错误率仅7.4%。该模型已在GitHub开源,提供三种规模版本。
Lemony.ai发布开源工具Cascadeflow,通过动态路由提示到最具成本效益的语言模型来削减AI应用开发成本。该软件采用级联管道,先使用小型廉价模型处理提示,根据质量指标评估结果,不达标则升级到更大模型。初步测试显示85%的提示可用小型模型处理,支持OpenAI、Anthropic等多个模型提供商,仅增加2毫秒延迟。
数据基础设施巨头Vast Data宣布扩大与云数据中心运营商CoreWeave的合作,签署11.7亿美元商业协议,强化VAST AI OS作为云端人工智能工作负载的主要数据基础。CoreWeave运营配备英伟达先进GPU的云数据中心网络,为企业客户提供AI算力服务。Vast AI OS采用"分解共享"架构,支持多种存储类型,提供低延迟数据访问。双方将为客户提供更先进的数据服务,优化数据管道,实现更快速高效的AI工作负载扩展。
谷歌宣布为云客户推出定制Ironwood芯片,这款张量处理单元可在单个pod中扩展至9216个芯片,成为该公司迄今最强大的AI加速器架构。新芯片将在未来几周内向客户提供,同时推出基于Arm的新Axion实例,承诺提供比当前x86替代方案高达两倍的性价比。该公司还扩展了Axion产品线,推出N4A第二代虚拟机和C4A金属实例预览版本。
谷歌最新一代Ironwood TPU v7加速器即将上市,在性能上已接近英伟达Blackwell GPU水平。每颗TPU提供4.6 petaFLOPS的FP8性能,配备192GB HBM3e内存。谷歌真正优势在于规模化能力,TPU pod最多可容纳9216颗芯片,理论上可扩展至40万颗加速器。采用3D环面拓扑和光学电路交换技术,在大规模计算集群方面具有独特优势。
Laude研究所周四宣布首批Slingshots资助计划,旨在推进人工智能科学与实践发展。该加速器项目为研究人员提供学术环境中难以获得的资源支持,包括资金、算力和产品工程支持。首批15个项目重点关注AI评估难题,包括命令行编程基准Terminal Bench和ARC-AGI项目最新版本。其他项目涵盖代码优化评估、白领AI代理基准测试等创新方向。
近期有观点认为,大规模使用生成式AI和大语言模型会增强人类左脑的逻辑分析能力,同时削弱右脑的创造力,导致人类社会逐渐成为左脑主导的群体。但研究表明,左右脑功能分工理论缺乏科学依据,大脑两半球在创造性和逻辑性任务中都会协同工作。此外,AI不仅能辅助逻辑思维,同样可用于诗歌创作、图像生成等创意任务。
微软全球AI巡展在迪拜举行,宣布启动Microsoft Elevate UAE项目,计划为超过25万名学生和教育工作者以及5.5万名联邦政府员工提供AI技能培训。该项目是微软152亿美元投资计划的一部分,旨在加强AI基础设施建设,培养本地人才能力。微软还将与G42和JAHIZ平台合作,为联邦公务员提供技术培训,支持阿联酋成为AI领域的区域和全球领导者。
思科发布计划升级校园、分支和工业网络以适应AI时代需求。新架构基于2025年推出的AI就绪安全网络架构,可在几分钟内实现自动化部署和安全防护,满足分布式AI工作负载的高带宽、超低延迟需求。思科向AgenticOps转型,通过AI代理与人工团队协作解决复杂问题。新功能包括统一网络可视化、校园管理简化、代理工作流自动化等,旨在简化运营、增强安全性并释放企业AI潜力。
Agentar全栈企业级智能体基座入选“互联网之光”博览会十大首发成果,能源时序大模型EnergyTS获“新光”产品奖,展现了蚂蚁数科推动的AI大模型与产业深度融合方面的领先成果。
谷歌地图将集成Gemini人工智能技术,旨在将其升级为一个"全知型副驾驶"助手。这一整合将大幅提升地图服务的智能化水平,为用户提供更加个性化和全面的导航体验。通过AI技术的加持,谷歌地图有望在路线规划、地点推荐和实时信息服务等方面实现重大突破。
微软研究人员发布新的仿真环境来测试AI智能体,研究显示当前智能体模型容易受到操纵。该名为"Magentic Marketplace"的合成平台让客户智能体与商家智能体进行交互实验。测试包括GPT-4o、GPT-5和Gemini-2.5-Flash等模型,发现智能体在面临过多选择时效率下降,且在协作方面表现不佳。研究揭示了AI智能体在无监督环境下的性能问题。
AI搜索提供商Perplexity开发了新的软件优化技术,让万亿参数大模型能在老旧、便宜的硬件上高效运行,包括使用亚马逊专有的弹性网络适配器。这项创新解决了大规模专家混合模型面临的内存和网络延迟挑战。研究显示,相比单节点配置,优化后的核心程序在多节点部署中实现了显著性能提升,使企业能更长时间利用现有硬件,或使用折扣云实例运行下一代前沿模型。
多数企业已从AI试点阶段转向可重复、可衡量的业务实践。Walgreens通过建立AI卓越中心实现有序创新,FMOL Health将ROI扩展到医生和患者满意度等非财务指标,Steelcase通过数据治理委员会建立AI信任框架,ZoomInfo让员工自主构建AI智能体实现人机协作。这些经验表明,成功的AI战略需要在创新与治理、自动化与人工判断之间找到平衡。
Sandbar公司推出Stream Ring智能戒指,专为随时记录灵感而设计。用户只需轻触戒指并轻声说话,即可将想法转录为笔记。该产品采用个性化数字语音技术,创造如自言自语般的体验。不同于传统AI助手,Stream Ring专注于认知扩展而非替代思考。产品配备全天候电池,支持私密范围内的语音识别。银色版售价249美元,金色版299美元,计划2026年夏季发货。
Alphabet旗下X实验室负责人泰勒透露,该公司正改变雄心勃勃技术项目的市场化策略,越来越多地将其拆分为独立公司而非保留在Alphabet体系内。这一策略依赖专门的风险基金Series X Capital,该基金已筹集超5亿美元,专门投资X实验室分拆项目。X实验室定义的月球计划需具备三要素:解决世界重大问题、提出相应产品或服务方案、利用突破性技术创造解决希望。
许多企业在急于采用AI时跳过了最重要的步骤:明确要解决的问题。Experian首席数据技术官强调,企业AI的真正工作不在于模型本身,而在于基础架构。从确保模型漂移检测、合规自动化到管理提示注入风险和用户治理,负责任AI的未来取决于幕后工作。成功始于扎实的工作流程、明确的目标和快速试错的文化。
亚马逊向AI搜索引擎Perplexity发出停止令,要求其停止允许用户创建和使用购物代理在亚马逊网站购买商品。争议核心在于控制权:亚马逊希望保持对用户购物体验的控制,而Perplexity认为AI代理只是技术进步的自然延伸。分歧在于透明度——Perplexity的代理使用用户凭据登录而不标识自己为AI代理。这被视为自主AI代理在商务领域的首次重大法律测试,将影响AI驱动网络的未来基础。
东芝发布S300 AI视频监控硬盘,容量从10TB大幅提升至24TB。该产品采用7200转速和6Gbps SATA接口,支持64路视频摄像头和32路AI数据流分析。容量范围涵盖8TB至24TB,缓存最高达1024MB,传输速度最高309MBps,年工作负载550TB。相比竞品西数Purple Pro和希捷SkyHawk AI,东芝在传输速度方面表现更优。产品将于2026年第一季度上市。
日立Vantara推出Hitachi iQ Studio智能体构建平台,帮助客户大规模构建、部署和管理AI智能体及应用。该平台基于Nvidia AI数据平台参考设计,提供无代码/低代码智能体构建工具和工业AI模板库。集成预构建RAG管道、模型上下文协议和即用算法,简化AI应用开发。支持本地大语言模型部署,内置预测性维护等工业环境蓝图,为企业提供完整的AI开发环境。