人工智能芯片初创公司Hailo Technologies Ltd.今日宣布正式发布Hailo-10H,这是其第二代AI加速器,具备强大的生成式AI能力。
Hailo-10H引入了全新的设备端能力,包括大语言模型、视觉-语言模型和其他生成式架构,无需依赖云端连接。
这款全新AI芯片基于该公司此前专注于视觉AI任务的Hailo-8处理器的成功经验。新芯片在保持针对边缘环境优化的高能效设计的同时,增加了对生成式AI的支持。Hailo-10H的典型功耗仅为2.5瓦,能够在个人设备、智能家居系统、汽车和电信基础设施等各类产品中支持复杂的AI应用。
"随着Hailo-10H现已开放订购,我们在实现让所有人都能使用AI的使命道路上又迈出了重要一步,"Hailo首席执行官兼联合创始人Orr Danon表示。"这是首款将真正的生成式AI性能带到边缘的独立AI处理器,集高效率、成本效益和强大软件生态系统于一体。"
Hailo-10H完全兼容Hailo现有的软件栈,并得到拥有超过10,000名月活跃用户的全球开发者社区支持。该芯片让开发者能够直接在边缘设备上运行最先进的视觉和生成式AI模型,提供超低延迟的实时响应能力。
该芯片还支持AI模型的超低延迟实时部署,可在不到一秒内完成首Token生成,在20亿参数模型上每秒处理超过10个Token。在视频应用场景中,它能够使用YOLOv11m等模型实现4K目标检测的最先进性能。
据Hailo称,通过实现本地处理,该芯片提升了数据隐私性并减少了对云端AI服务的依赖,同时还有助于降低运营成本。它符合汽车级AEC-Q100 Grade 2标准认证,目标在2026年应用于座舱显示和驾驶员监控等汽车系统的量产。
Hailo是一家获得风险投资支持的初创公司,已在九轮融资中筹集了5.64亿美元,包括2021年10月的1.36亿美元。该公司的投资者包括SKC Co. Ltd.、5AM Ventures LP、Versant Ventures LP、GPB Capital Holdings、Reedland Capital Partners和三菱UFJ资本有限公司。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。