在人工智能应用中,处理大量计算任务的模块被广泛使用。CPU负责其他非计算任务。人工智能推动了计算领域的新一轮革命,深度学习需要进行海量数据的并行计算,然而传统的计算架构无法满足深度学习中大规模的并行计算需求。因此,为了加速计算过程,深度学习需要适应新的底层硬件,以更好地支持此类算法。为了响应人工智能和深度学习的需求,人们对芯片的速度和能耗提出了更高的要求。目前,使用的GPU和FPGA等不是专门为人工智能定制的芯片,它们存在天然的局限性。除了广受欢迎的GPU之外,也出现了许多典型的人工智能专用芯片,以满足不同应用场景的需求。