时间:2019-05-23 14:55
人气:
作者:admin
图:企业AI/ML部署需求增长趋势
伴随这一趋势,AI的算法在不断演进,对数值精度的选择要求也更加多元,高效算力、高效丰富的存储缓存能力以及高效大带宽的数据运送能力,是AI/ML硬件解决方案所面临的主要挑战。系统开发者会利用FPGA架构去优化功耗、性能和灵活性,并突破处理单元在效率上的瓶颈,包括计算引擎、内存层次结构和数据移动。
图:算法和精度要求不同给处理带来挑战
就AI的应用而言,不同场景应用对FPGA的需求不同。通常云计算中的应用主要是需要FPGA在AI/ML和高带宽数据加速上的能力,而在端侧则需要在高灵活性的同时还要具有ASIC的性能。虽然,FPGA已经大量应用于泛AI领域,但它是否很好的满足这两个方面的需求,还是一个值得探讨的话题。
“Speedster7t是我们历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀。”Achronix公司董事长兼首席执行官Robert Blake介绍,“该器件采用TSMC的7nm FinFET工艺制造,专为ML和高带宽网络应用进行了优化。”具体而言,相较于目前的FPGA,Speedster7t革新之处在于设计了针对ML的处理器(MLP),以及一个可横跨和垂直跨越FPGA逻辑阵列的高带宽的二维片上网络(NOC),二者结合既保留了FPGA的灵活性,又实现了ASIC的性能。
图:在FPGA中采用MLP(右)比DSP(左)更适用于AI/ML处理
“最重要的是,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。”Blake说,“这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。”图:NOC是在FPGA路由结构上的另一个重要革新 的确,NOC这一方法解决了GDDR6、400G以太网MAC这些片上资源海量数据传输的问题。Speedster7t是目前市面唯一支持GDDR6存储器的FPGA,可以支持4 Tbps的GDDR6累加带宽,可以很小的成本提供与基于HBM的FPGA等效存储带宽。相较于HBM,GDDR6只需要一半的成本就可以满足高存储层次和带宽的需求,并且,HBM是固化的块,GDDR6则更灵活,用户可以选择不同容量和带宽。 NOC也解决了传统FPGA的运行速度无法满足任何400G以太网总线宽度要求的问题,400G以太网的总线大小达1024bit,所需的最高频率达到724 MHz,这在传统FPGA中无法实现,NOC由于消除了传统设计中与FPGA布线相关的延迟,所以可以最高支持750 MHz的频率,这满足了MLP和嵌入式存储器模、400G以太网MAC及高速SerDes之间的数据传输。
Fidus Sidewinder-100集成PCIe NVMe 控制系统,有