物联网与MCU往智能化方向发展-睿象云平台

物联网与MCU往智能化方向发展

本站部分文章、图片属于网络上可搜索到的公开信息，均用于学习和交流用途，不能代表睿象云的观点、立场或意见。我们接受网民的监督，如发现任何违法内容或侵犯了您的权益，请第一时间联系小编邮箱jiasou666@gmail.com 处理。

物联网与MCU往智能化方向发展

智能物联网与MCU智能化

有些应用(如摄像头内容分析)的模型部署在云端，即终端把原始数据完全回传给云端，云端在该数据上执行深度学习模型的推理，之后把结果发回给终端，终端再根据云端的结果执行相应操作;而在自动驾驶等应用中模型必须部署在终端，即终端收集到数据后在本地执行深度学习模型的推理，并根据结果作出相应动作。在智能工业等需要在终端执行深度学习模型推理的场景，原来用来执行相关动作的MCU就必须能够支持这样的深度学习推理计算，这也就是MCU的智能化。

通常来说，机器学习模型必须部署在终端执行的理由包括传输带宽、反应延迟和安全性等。从传输带宽来考虑，目前物联网中节点分布在各种场景中，如果要把原始数据直接传输到云端，则带宽开销非常大，而且无线传输的能量开销也不小。而如果在终端部署机器学习推理则可以省下带宽的开销，只需要有选择性地把部分重要数据传送到云端，而无需传输全部原始数据。

最后，数据的安全性也是一个考量，对于一些敏感应用来说将数据通过网络传送给云端服务器意味着存在着数据被入侵的风险——如果黑客通过破解智能工厂与云端服务器的数据从而控制整个工厂将会给工厂带来巨大损失——而如果把这些计算放在本地则会安全地多。

根据上述的场景，我们认为需要执行本地机器学习推理计算的MCU主要会运行在如下场景中：

智能生产，需要快速反应且重视数据的安全性，如根据声音识别机器故障等;

智能家电，如智能空调根据人的位置智能送风等;

智能可穿戴设备，如根据人体的生理信号给出相应提示等。

随着上述在终端部署执行机器学习推理计算的需求，一些原来只负责执行基本程序的MCU也必须要有能力能跑动机器学习推理计算。这对于MCU的挑战在于算力，因为在这一波人工智能的浪潮中，训练好的模型所需要的计算量通常是数十万次计算到数亿次计算不等，如果需要实时执行这些运算则MCU需要的算力将会比原来的MCU强几个数量级。

另外，智能MCU对功耗和实时性也有很高要求，这就需要MCU设计能有相应改变。目前，MCU正处于8位更新换代到32位的过程中，我们预计在32位MCU的基础上，智能化会成为下一个MCU的演进方向。

智能化技术路径一：整合加速器IP

ARM的Cortex系列架构占据着32位MCU的主导位置，所以ARM推进智能MCU的方法需要兼顾其Cortex架构，不能为了推智能化MCU结果把自己的命给革了。因此，ARM选择的方法是给Cortex核搭配一个独立的加速器IP，当需要执行机器学习相关算法时调用这个加速器IP去做计算，而当做传统操作时还是使用Cortex。

ARM ML Processor是典型的加速器架构，它有自己的指令集，只能执行和机器学习相关的运算加速而无法运行其他程序，因此必须搭配Cortex核才能发挥作用。ARM ML Processor可以最高实现4.6TOPS的算力，同时最高能效比可达3TOPS/W，性能实属优秀，对于算力需求不高的场合也可以通过降低运行速度来降低功耗，以满足MCU的需求。

应该说目前基于专用机器学习加速器IP的智能MCU尚处于蓄势待发阶段。顾名思义，专用机器学习加速器通过专用化的设计实现了很高的能效比，然而这也限制了应用范围，只能加速一部分机器学习算法，而无法顾及通用性。

然而，对于MCU来说，专注于卷积神经网络加速却未必是一个最优化的选择。首先，MCU市场的应用存在一定碎片化，而一个专用的加速器很难覆盖多个应用，因此对于习惯了设计标准化MCU并走量覆盖许多个市场的半导体厂商来说是否使用专用化加速器是一个需要仔细考虑的选择。换句话说，许多应用中希望智能MCU能高效执行基于非卷积神经网络的机器学习算法(例如SVM，决策树等等)，那么这些应用就无法被一个专用的卷积神经网络加速器覆盖到，而需要设计另外一套加速器。当然，这对于IP商ARM来说不是件坏事，因为ARM可以快速提升其机器学习加速器的IP品类数量并从中获利，但是对于半导体公司来说却有些头疼。

此外，卷积神经网络最成功的应用是机器视觉，然而在MCU应用中除了机器视觉之外还有许多其他应用，甚至可以说智能MCU的应用中机器视觉并非最大的市场，这也限制了只能处理卷积神经网络的专用加速器IP的市场。

智能化路径二：处理器架构改良

根据上面的讨论，ARM因为之前使用Cortex核占领了MCU市场，因此其保留Cortex架构不变并力推能搭配Cortex核使用的专用加速器IP也是必然的商业逻辑。然而，基于专用机器学习加速器IP的智能MCU在碎片化应用中会遇到应用覆盖过窄的问题，这也就是为什么还存在第二条MCU智能化的技术路径——改良处理器架构。

处理器架构改良意味着直接设计一个低功耗高算力的通用处理器，这样就可以覆盖几乎所有MCU应用，从而避免了专用加速器的通用性问题。当然，在处理器设计中，往往需要从指令集开始全盘重新设计，因此需要很大的投入。

另外值得指出的是，新处理器架构和专用加速器并非水火不容，完全可以在使用新处理器架构的同时集成一个专用加速器，从而使用专用加速器去加速特定的应用，而使用通用化的新架构处理器去处理高效处理其他应用。这里专用与通用的选择完全则很大程度上取决于市场的需求以及潜在的商业回报。

结语

人工智能和物联网的结合推进了智能MCU概念。我们预计在未来几年将会看到智能MCU的普及，而在智能MCU的两条技术路径之间选择则不仅会影响MCU市场，更有可能会对于半导体生态造成深远影响——如果专用加速器IP获胜，则ARM将继续成为智能MCU的领导者，反之如果新架构获胜则ARM将会遇到强力的挑战。

智能告警平台CA如何分组及邀请成员

813 2023-02-08

物联网与MCU往智能化方向发展

睿象云智能告警平台的分派策略

智能告警平台CA如何分组及邀请成员

智能告警平台CA的用户角色和权限