人工智能芯片初创公司Hailo Technologies Ltd.今日宣布正式发布Hailo-10H,这是其第二代AI加速器,具备强大的生成式AI能力。
Hailo-10H引入了全新的设备端能力,包括大语言模型、视觉-语言模型和其他生成式架构,无需依赖云端连接。
这款全新AI芯片基于该公司此前专注于视觉AI任务的Hailo-8处理器的成功经验。新芯片在保持针对边缘环境优化的高能效设计的同时,增加了对生成式AI的支持。Hailo-10H的典型功耗仅为2.5瓦,能够在个人设备、智能家居系统、汽车和电信基础设施等各类产品中支持复杂的AI应用。
"随着Hailo-10H现已开放订购,我们在实现让所有人都能使用AI的使命道路上又迈出了重要一步,"Hailo首席执行官兼联合创始人Orr Danon表示。"这是首款将真正的生成式AI性能带到边缘的独立AI处理器,集高效率、成本效益和强大软件生态系统于一体。"
Hailo-10H完全兼容Hailo现有的软件栈,并得到拥有超过10,000名月活跃用户的全球开发者社区支持。该芯片让开发者能够直接在边缘设备上运行最先进的视觉和生成式AI模型,提供超低延迟的实时响应能力。
该芯片还支持AI模型的超低延迟实时部署,可在不到一秒内完成首Token生成,在20亿参数模型上每秒处理超过10个Token。在视频应用场景中,它能够使用YOLOv11m等模型实现4K目标检测的最先进性能。
据Hailo称,通过实现本地处理,该芯片提升了数据隐私性并减少了对云端AI服务的依赖,同时还有助于降低运营成本。它符合汽车级AEC-Q100 Grade 2标准认证,目标在2026年应用于座舱显示和驾驶员监控等汽车系统的量产。
Hailo是一家获得风险投资支持的初创公司,已在九轮融资中筹集了5.64亿美元,包括2021年10月的1.36亿美元。该公司的投资者包括SKC Co. Ltd.、5AM Ventures LP、Versant Ventures LP、GPB Capital Holdings、Reedland Capital Partners和三菱UFJ资本有限公司。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。