决定计算速度的一个重要因素是ALU(Arithmetic & logical Unit,算数逻辑单元)的数量。CPU 架构中的大部分被Cache和控制电路占据,仅有几个ALU 单元(一般是单核、双核、四核等,最多的AMD 皓龙处理器有十六核),因而CPU 更擅长复杂的逻辑控制,计算能力只是CPU 很小的一部分。而GPU则包括数以千计的更小、更高效的核心(英伟达K80 有5700 个核),因此常被称为“众核”;GPU 只有非常简单的控制逻辑并省去了Cache,适合把同样的指令流并行发送到众核上,进