人工智能芯片初创公司Hailo Technologies Ltd.今日宣布正式发布Hailo-10H,这是其第二代AI加速器,具备强大的生成式AI能力。
Hailo-10H引入了全新的设备端能力,包括大语言模型、视觉-语言模型和其他生成式架构,无需依赖云端连接。
这款全新AI芯片基于该公司此前专注于视觉AI任务的Hailo-8处理器的成功经验。新芯片在保持针对边缘环境优化的高能效设计的同时,增加了对生成式AI的支持。Hailo-10H的典型功耗仅为2.5瓦,能够在个人设备、智能家居系统、汽车和电信基础设施等各类产品中支持复杂的AI应用。
"随着Hailo-10H现已开放订购,我们在实现让所有人都能使用AI的使命道路上又迈出了重要一步,"Hailo首席执行官兼联合创始人Orr Danon表示。"这是首款将真正的生成式AI性能带到边缘的独立AI处理器,集高效率、成本效益和强大软件生态系统于一体。"
Hailo-10H完全兼容Hailo现有的软件栈,并得到拥有超过10,000名月活跃用户的全球开发者社区支持。该芯片让开发者能够直接在边缘设备上运行最先进的视觉和生成式AI模型,提供超低延迟的实时响应能力。
该芯片还支持AI模型的超低延迟实时部署,可在不到一秒内完成首Token生成,在20亿参数模型上每秒处理超过10个Token。在视频应用场景中,它能够使用YOLOv11m等模型实现4K目标检测的最先进性能。
据Hailo称,通过实现本地处理,该芯片提升了数据隐私性并减少了对云端AI服务的依赖,同时还有助于降低运营成本。它符合汽车级AEC-Q100 Grade 2标准认证,目标在2026年应用于座舱显示和驾驶员监控等汽车系统的量产。
Hailo是一家获得风险投资支持的初创公司,已在九轮融资中筹集了5.64亿美元,包括2021年10月的1.36亿美元。该公司的投资者包括SKC Co. Ltd.、5AM Ventures LP、Versant Ventures LP、GPB Capital Holdings、Reedland Capital Partners和三菱UFJ资本有限公司。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。