大多数智能设备仍需要互联网连接才能实现智能功能,因为最强大的模型都存储在云端。边缘设备公司希望让设备本身具备思考能力。为了满足这些需求,台湾半导体公司新唐科技推出了全新的微控制器芯片NuMicro M55M1,该芯片将Arm Cortex M55处理器与Arm Ethos U55"神经处理单元"引擎集成在一个低功耗微控制器中。这使得任何使用该嵌入式芯片的设备都能处理语音触发、姿态识别、手势操作和视觉任务,而无需访问云端或大数据。
为什么这对日常产品很重要
人工智能在日常设备中变得不可避免。制造商越来越希望在不依赖持续在线访问的情况下嵌入智能功能。此外,这些制造商希望避免依赖第三方模型带来的高成本、不稳定性和潜在的不可预测性。
为了解决这些需求,技术供应商越来越关注可嵌入的微型设备端模型,这些模型可以在不连接到可能由他人拥有和运营的在线模型的情况下运行。
许多设备端AI需求可能很简单。例如,想象一个对挥手或语音做出反应的玩具,或者只有在看到人而不是窗帘时才会激活的门铃。这些看起来像是简单的任务,但将原始音频或视频流传输到云端会使它们变得缓慢且耗电。将模型推理移到微控制器中可以缩短传感器和答案之间的距离。然而,微控制器通常无法处理如此密集的AI任务。
在技术层面,新唐的M55M1是一个32位微控制器,配备了以相同时钟速度运行的Cortex M55处理器和Ethos U55神经处理单元。U55处理神经网络数学运算,而Cortex M55负责监控定时器和外设。这种分工保持了低延迟和合理的电池寿命。
该设备可以处理设备端机器学习、数字信号处理,并支持常见的嵌入式机器学习流程。配套的NuEzAI M55M1开发板提供了对该技术栈的访问,并附带示例,使开发人员能够在硬件上构建、编译和测试,而不是使用更繁琐的工具。开发板和芯片的处理器和神经处理单元最高运行频率约为220 MHz,这很重要,因为工程师可以根据实际数字来平衡速度、能耗和内存。
微型模型和AI驱动微控制器的性能对比
微控制器上220 MHz的神经处理单元无法运行大型Transformer或密集检测模型。但它可以运行针对检测小图像或短音频片段等简单任务进行量化和调优的紧凑网络。目标是在毫瓦级功耗下实现稳定、可预测的推理,而无需云端访问。新唐的AI页面和新闻稿坚持这一用例,这与嵌入式控制器的需求很好匹配。
AI微控制器和嵌入式AI系统市场正在升温。芯片制造商英飞凌的PSoC Edge系列也结合了Cortex M55和Ethos U55,该公司最近增加了对英伟达TAO工作流程的支持,降低了适配视觉模型的门槛。
在高端市场,Alif Semiconductor的Ensemble E3部件配备双U55引擎和大型片上内存池,以处理更重的边缘AI任务,同时仍然是微控制器。该芯片支持更大的图像、更高的帧率或同时运行多个模型。
对嵌入式微型模型的需求不断增长
对微型可嵌入模型的兴趣持续增长。公司每年发货数百亿个微型微控制器,因为它们便宜、可预测且易于认证。添加一个小型神经引擎,就能在紧凑的离线模型中获得良好的基础AI推理能力。这意味着更智能的灯光开关、可穿戴设备和安全传感器可以在纽扣电池或电源适配器供电下全天运行,而无需流量费用。
虽然市场仍处于早期阶段,难以判断对AI微控制器的需求有多大,但像新唐这样的公司正在投资以抢占需求先机。新唐是半导体制造商华邦电子的分拆公司,拥有一个六英寸晶圆厂,提供代工服务,月产能约45,000片晶圆。这为规划AI产品的公司提供了成熟工艺和专业流程的规模感。
如果该公司的方法取得成功,我们可以期待看到更多设备使用微型、本地、嵌入式AI。
Q&A
Q1:新唐M55M1微控制器有什么特别之处?
A:新唐M55M1是一个32位微控制器,将Arm Cortex M55处理器与Arm Ethos U55神经处理单元集成在同一芯片中。它能让设备在不连接云端的情况下处理语音触发、姿态识别、手势操作和视觉任务,实现真正的边缘AI功能。
Q2:为什么需要在微控制器中集成AI功能?
A:主要原因是避免依赖云端AI模型带来的高成本、延迟和不稳定性。通过在设备端进行AI推理,可以缩短传感器和响应之间的距离,降低功耗,同时保护用户隐私,让设备在离线状态下也能保持智能功能。
Q3:这种AI微控制器适合什么样的应用场景?
A:适合处理简单的AI任务,如检测小图像或短音频片段。典型应用包括对挥手或语音做出反应的智能玩具、只在检测到人时才激活的智能门铃、更智能的灯光开关、可穿戴设备和安全传感器等日常智能产品。
好文章,需要你的鼓励
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。
苹果即将发布Apple TV 4K和HomePod mini 2两款产品更新。更值得期待的是三款全新产品:配备7英寸方形显示屏的HomePod Touch将搭载全新homeOS系统,支持Safari、音乐等应用及小组件功能,预计售价350美元;此外还有智能安全摄像头和视频门铃两款配件。这标志着苹果从依赖第三方HomeKit配件转向自主研发智能家居产品的重要战略转变。
UCL研究团队通过分析16万场AI对战数据发现,传统认为"平局代表AI实力相当"的观念完全错误。研究表明平局主要反映问题难度和客观性,而非AI能力对比。当忽略平局进行评分时,四种主流评分系统的预测准确率均提升1-3%。这项发现颠覆了现有AI评估理论,建议未来评分系统应考虑问题特征而非简单的平局语义。