大多数智能设备仍需要互联网连接才能实现智能功能,因为最强大的模型都存储在云端。边缘设备公司希望让设备本身具备思考能力。为了满足这些需求,台湾半导体公司新唐科技推出了全新的微控制器芯片NuMicro M55M1,该芯片将Arm Cortex M55处理器与Arm Ethos U55"神经处理单元"引擎集成在一个低功耗微控制器中。这使得任何使用该嵌入式芯片的设备都能处理语音触发、姿态识别、手势操作和视觉任务,而无需访问云端或大数据。
为什么这对日常产品很重要
人工智能在日常设备中变得不可避免。制造商越来越希望在不依赖持续在线访问的情况下嵌入智能功能。此外,这些制造商希望避免依赖第三方模型带来的高成本、不稳定性和潜在的不可预测性。
为了解决这些需求,技术供应商越来越关注可嵌入的微型设备端模型,这些模型可以在不连接到可能由他人拥有和运营的在线模型的情况下运行。
许多设备端AI需求可能很简单。例如,想象一个对挥手或语音做出反应的玩具,或者只有在看到人而不是窗帘时才会激活的门铃。这些看起来像是简单的任务,但将原始音频或视频流传输到云端会使它们变得缓慢且耗电。将模型推理移到微控制器中可以缩短传感器和答案之间的距离。然而,微控制器通常无法处理如此密集的AI任务。
在技术层面,新唐的M55M1是一个32位微控制器,配备了以相同时钟速度运行的Cortex M55处理器和Ethos U55神经处理单元。U55处理神经网络数学运算,而Cortex M55负责监控定时器和外设。这种分工保持了低延迟和合理的电池寿命。
该设备可以处理设备端机器学习、数字信号处理,并支持常见的嵌入式机器学习流程。配套的NuEzAI M55M1开发板提供了对该技术栈的访问,并附带示例,使开发人员能够在硬件上构建、编译和测试,而不是使用更繁琐的工具。开发板和芯片的处理器和神经处理单元最高运行频率约为220 MHz,这很重要,因为工程师可以根据实际数字来平衡速度、能耗和内存。
微型模型和AI驱动微控制器的性能对比
微控制器上220 MHz的神经处理单元无法运行大型Transformer或密集检测模型。但它可以运行针对检测小图像或短音频片段等简单任务进行量化和调优的紧凑网络。目标是在毫瓦级功耗下实现稳定、可预测的推理,而无需云端访问。新唐的AI页面和新闻稿坚持这一用例,这与嵌入式控制器的需求很好匹配。
AI微控制器和嵌入式AI系统市场正在升温。芯片制造商英飞凌的PSoC Edge系列也结合了Cortex M55和Ethos U55,该公司最近增加了对英伟达TAO工作流程的支持,降低了适配视觉模型的门槛。
在高端市场,Alif Semiconductor的Ensemble E3部件配备双U55引擎和大型片上内存池,以处理更重的边缘AI任务,同时仍然是微控制器。该芯片支持更大的图像、更高的帧率或同时运行多个模型。
对嵌入式微型模型的需求不断增长
对微型可嵌入模型的兴趣持续增长。公司每年发货数百亿个微型微控制器,因为它们便宜、可预测且易于认证。添加一个小型神经引擎,就能在紧凑的离线模型中获得良好的基础AI推理能力。这意味着更智能的灯光开关、可穿戴设备和安全传感器可以在纽扣电池或电源适配器供电下全天运行,而无需流量费用。
虽然市场仍处于早期阶段,难以判断对AI微控制器的需求有多大,但像新唐这样的公司正在投资以抢占需求先机。新唐是半导体制造商华邦电子的分拆公司,拥有一个六英寸晶圆厂,提供代工服务,月产能约45,000片晶圆。这为规划AI产品的公司提供了成熟工艺和专业流程的规模感。
如果该公司的方法取得成功,我们可以期待看到更多设备使用微型、本地、嵌入式AI。
Q&A
Q1:新唐M55M1微控制器有什么特别之处?
A:新唐M55M1是一个32位微控制器,将Arm Cortex M55处理器与Arm Ethos U55神经处理单元集成在同一芯片中。它能让设备在不连接云端的情况下处理语音触发、姿态识别、手势操作和视觉任务,实现真正的边缘AI功能。
Q2:为什么需要在微控制器中集成AI功能?
A:主要原因是避免依赖云端AI模型带来的高成本、延迟和不稳定性。通过在设备端进行AI推理,可以缩短传感器和响应之间的距离,降低功耗,同时保护用户隐私,让设备在离线状态下也能保持智能功能。
Q3:这种AI微控制器适合什么样的应用场景?
A:适合处理简单的AI任务,如检测小图像或短音频片段。典型应用包括对挥手或语音做出反应的智能玩具、只在检测到人时才激活的智能门铃、更智能的灯光开关、可穿戴设备和安全传感器等日常智能产品。
好文章,需要你的鼓励
在TechCrunch Disrupt大会上,三位投资人分享了优秀融资演示的制胜秘诀。他们强调,创业者应避免过度使用AI等流行词汇,重点关注三个核心问题:市场规模是否足够大、创始人是否具备独特优势、是否有客户验证。对于AI初创企业,投资人建议要有明确的领域专业知识和竞争策略,诚实面对竞争对手,专注于产品构建而非概念炒作。
新加坡国立大学联合Lovart AI开发的OmniPSD系统,首次实现了AI驱动的双向PSD文件处理能力。该系统能够将扁平图像自动分解为可编辑的图层结构,同时支持从文字描述直接生成分层设计文件。基于扩散变换器架构和创新的RGBA-VAE技术,OmniPSD在20万真实设计样本上训练,实现了专业级的透明度处理和图层分解效果,为设计行业的数字化转型提供了强大工具。
苹果在iOS 14.5中推出的应用跟踪透明度功能要求开发者获得用户许可才能共享数据。用户可选择"允许"或"要求应用不跟踪"。选择后者会阻止应用访问IDFA标识符,但开发者仍可通过IP地址等其他方式跟踪用户。该功能推出后,可跟踪用户比例从73%降至18%,迫使广告商转向设备指纹识别等替代方案。
ByteDance Seed团队提出UniUGP统一框架,首次将自动驾驶的理解、生成、规划三大能力完美融合。通过混合专家架构和四阶段训练策略,该系统在场景理解、轨迹规划和视频生成等任务上均超越现有先进模型,为自动驾驶技术发展开辟了新路径,预示着更智能可靠的无人驾驶未来。