“到2019年10月,经过三年多的转型,英特尔‘以数据为中心’的业务营收在上个季度(2019年Q3)已经与PC业务持平,这是非常大的变化。”在12月19日举办的英特尔技术创新媒体沟通会上,英特尔中国研究院院长宋继强晒出了数据中心业务的成绩单。 几天前,英特尔刚刚宣布以20亿美元收购AI芯片制造商Habana Labs,以增强数据中心AI产品的能力。从2017年确立“以数据为中心”的转型目标至今,英特尔致力于构建未来十年甚至二十年IT产业发展的基础和驱动未来的计算方式。“我们为现在的计算需求打下基础,也要为未来更大量、更多样化的数据处理打下基础。所以是既考虑现在,也考虑未来。”宋继强说。 与通用计算相对,异构计算面向专业化、客制化的计算需求,在计算任务中应用CPU、GPU、ASIC、FPGA等多种计算架构,被视为更适合后摩尔时代的计算方式。 产业界不断加码异构计算,是因为从20世纪90年代至今,数据的量和质都发生了巨大的变化。2000年之前的web1.0,计算设备以PC为主,数据类型以结构化数据和图形数据为主。多媒体中心(Studio)生成数据后,通过下行带宽分发到用户终端。到了web2.0时代,用户从被动获取数据走向主动产生数据,服务器和PC同等重要,催生了云生态。同时,消费级终端开始支持视觉数据、声音数据等多媒体数据的处理,对计算提出了新的要求。 到web3.0,IoT让更多设备入网,产生的数据被AI深度挖掘,转化为业务价值。AI在训练、推理过程中产生大量元数据。随着IoT传感器越来越多,还会产生大量自然描述的数据,如深度数据、三维点云及工业传感级数据等。“数据的变化表现在两个方面,一是量快速增长,来自边缘、终端的数据越来越多。二是本质和格式发生了重大变化。”宋继强说。 来自端、边、云,对延时、成本、算法有着不同需求的数据,正在驱动计算架构的演进和扩展,异构计算渐成趋势。CPU适合标量运算,GPU可用于矩阵运算或者加速器,ASIC等定制的可编程硬件可作为AI专用的加速器。空间运算,即在矩阵中用最少的路径计算,可以用FPGA实现流程定制,这些架构构成了异构计算的常用组件。宋继强表示,在CPU和嵌入式GPU的基础上,通过对FPGA厂商Altera、ASIC厂商Nervana、结构化ASIC厂商eASIC等厂商的收购,英特尔已经掌握了CPU、GPU、ASIC、FPGA四种不同架构。 在异构计算的基础上,英特尔提出了“超异构计算”,即采用多功能、多架构的芯片处理和加速不同的运算负载,采用封装集成技术将计算单元封装在一个SoC,并具备统一异构计算软件的计算架构。在异构计算的基础上,避开异构计算的短板,实现计算最优化,是超异构计算的意义所在。 除具备多种计算架构,超计算架构还需要封装和统一的计算软件。为此,英特尔推出了封装级别的异构整合方案和跨计算架构的软件平台。 英特尔的异构整合方案主要有2.5D封装EMIB和3D封装Foveros。EMIB实现芯片的横向连通,支持CPU、图形卡、IO及多芯片间的通信。Foveros将不同制程、不同性价比、不同稳定性的芯片,根据功耗等要求放在不同层级,在三维空间提高晶体管密度和多功能集成。总的来说,EMIB泛用性更好,性价比较高,而Foveros相对昂贵,多用在小尺寸、低功耗、高性能的异构芯片中。 统一的异构计算软件平台,是为了提升编程效率,解决不同架构有着不同的汇编语言和调优方式的问题。英特尔的one API平台隐藏了硬件复杂性,根据系统和硬件自动适配功耗最低、性能最佳的加速方式,简化并优化编程过程。“one API已经有一套基于开放规范的行业计划,不仅英特尔将产品加入其中,第三方做的硬件,只要提供了相应产品的描述,也可以加进来,加入one API的优化篮子。”宋继强说。 在此基础上,英特尔推出了Aurora超级计算机架构。Aurora包含one API,采用Foveros 3D封装,配置了2个英特尔至强可扩展处理器、6个基于CXL标准的GPU,采用7nm制程。宋继强表示,Aurora是“一个典型的超异构计算”,面向百亿亿次级的计算需求。 |