人工智能芯片初创公司Hailo Technologies Ltd.今日宣布正式发布Hailo-10H,这是其第二代AI加速器,具备强大的生成式AI能力。
Hailo-10H引入了全新的设备端能力,包括大语言模型、视觉-语言模型和其他生成式架构,无需依赖云端连接。
这款全新AI芯片基于该公司此前专注于视觉AI任务的Hailo-8处理器的成功经验。新芯片在保持针对边缘环境优化的高能效设计的同时,增加了对生成式AI的支持。Hailo-10H的典型功耗仅为2.5瓦,能够在个人设备、智能家居系统、汽车和电信基础设施等各类产品中支持复杂的AI应用。
"随着Hailo-10H现已开放订购,我们在实现让所有人都能使用AI的使命道路上又迈出了重要一步,"Hailo首席执行官兼联合创始人Orr Danon表示。"这是首款将真正的生成式AI性能带到边缘的独立AI处理器,集高效率、成本效益和强大软件生态系统于一体。"
Hailo-10H完全兼容Hailo现有的软件栈,并得到拥有超过10,000名月活跃用户的全球开发者社区支持。该芯片让开发者能够直接在边缘设备上运行最先进的视觉和生成式AI模型,提供超低延迟的实时响应能力。
该芯片还支持AI模型的超低延迟实时部署,可在不到一秒内完成首Token生成,在20亿参数模型上每秒处理超过10个Token。在视频应用场景中,它能够使用YOLOv11m等模型实现4K目标检测的最先进性能。
据Hailo称,通过实现本地处理,该芯片提升了数据隐私性并减少了对云端AI服务的依赖,同时还有助于降低运营成本。它符合汽车级AEC-Q100 Grade 2标准认证,目标在2026年应用于座舱显示和驾驶员监控等汽车系统的量产。
Hailo是一家获得风险投资支持的初创公司,已在九轮融资中筹集了5.64亿美元,包括2021年10月的1.36亿美元。该公司的投资者包括SKC Co. Ltd.、5AM Ventures LP、Versant Ventures LP、GPB Capital Holdings、Reedland Capital Partners和三菱UFJ资本有限公司。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。