骑猪兜风

默秒全的效能比 ARM Cortex-A32架构分析

骑猪兜风 2016-02-24 19:31:43    200790 次浏览

在大家喜迎骁龙820到来之际,ARM也发布了面向嵌入式设备和IoT(物联网)的新构架——Cortex-A32。ARM构架的处理器凭借其优秀的能耗 比,一直占据着移动/嵌入式设备市场。其因为智能手机的爆发而为大家所熟知,A8/A9/A15、A12/A53/A57/A72等一代代CPU构架更是 机友心中的时代印记。而刚发布的A32,又在效能比上越走越远了。

默秒全的效能比 ARM Cortex-A32架构分析

默秒全的效能比 ARM Cortex-A32架构分析

ARM的家谱与定位

Cortex-A系列分为高性能、低功耗和超低功耗3类:

  • 高性能系列的代表当然是ARM的大核构架Cortex A57和A72(还有在慢慢退市的A15和A17);

  • 低功耗系列的代表是高效能比的A53,根据需求,它可以以多核,或者 big.LITTLE大小核的形式工作;

  • 而超低功耗系列,在A5和A7之后,有2015年11月推出的A35和刚刚推出的A32。

在A35出来的时候我们进行过分析,可以戳右边的文章查看:《你们都得退休!ARM Cortex-A35构架分析》。

值得注意的是,A32是ARM新一代构架中,唯一一个32位构架。但A32就像是32位版的A35,目标很明显,就是在效能比本来就逆天的A35的基础上进一步控制功耗。

超低功耗与超小芯片面积

默秒全的效能比 ARM Cortex-A32架构分析

A32构架图

A32构架主打芯片面积、功耗控制和能耗比,其停留在32位(ARMv7-A指令集),指令预取单元针对效率进行了重新设计,一、二级缓存、浮点和DSP操作性能则针对速度进行了改进,并引入了新的电源管理特性。其支持TrustZone安全加密、NEON SIMD指令集、DSP/SIMD扩展、VFPv4浮点计算、硬件虚拟化等。

根据需求A32可以使用28nm、40nm等工艺制造,核心数目也可以在1/2/4核之间组合,可以组成big.LITTLE 大小核结构的 SoC。

默秒全的效能比 ARM Cortex-A32架构分析

A35的核心大小示意图,A32居然还能做得更小

极限情况下,单核心加8KB一级缓存的最简配版本可以把芯片面积控制在0.25平方毫米(A35的极限也只是0.4平方毫米。而官方称28nm工艺制造的版本,在100MHz频率下的功耗只有0.004W(4mW)。

效能比再次提升

默秒全的效能比 ARM Cortex-A32架构分析

整数、浮点、加密与流媒体等性能对比图(加密性能更是抛离A5足足12倍)

默秒全的效能比 ARM Cortex-A32架构分析

性能与功耗对比

除去超小的芯片面积和能耗外,A32可以在32位下提供和A35一样的性能。但更低功耗,让它的效能比(单位电能产出的性能)比A35还要高10%,比A5高30%,比A7高25%。A35可以通过提升频率达到A53 80-100%性能,也就是说,A32也可以在32位下达到同样的性能等级,这时候的芯片面积只有A53的68%,而功耗则只有A53的61%。

在64位之下,A35都有代替A53构架的实力,而在32位中,A32就已经是默秒全的境界了,而且比起64位的A35构架,32位的A32更适合用在穿戴设备和物联网产品上。

如果说A35有可能是下一代手机处理器中的小核心首选,那A32就已经是下一代穿戴设备和物联网产品的“默认方案”了。

内容加载中