英特尔近日宣布英特尔至强处理器产品家族迎来两位新成员:Cascade Lake-AP(预计2019年上半年发布)和面向入门级服务器的英特尔至强E-2100处理器(现已正式发布)。这两个新产品系列建立在英特尔至强平台长达20年的领导地位之上,让客户可以更加灵活地选择最符合自身需求的解决方案。
“我们一直致力于提供能满足客户系统需求的各种工作负载优化解决方案。此次新品Cascade Lake-AP CPU和至强E-2100处理器的加入,再次展示了我们向广大客户提供性能优化解决方案的承诺。”
——Lisa Spelman,英特尔副总裁兼英特尔至强产品与数据中心营销总经理
Cascade Lake-AP代表了一种全新类型的英特尔至强可扩展处理器,专为要求苛刻的高性能计算(HPC)、人工智能(AI)和基础架构即服务(IaaS)工作负载而设计。该处理器采用性能优化的多芯片封装,每颗CPU最多可提供48个内核,每个插槽可提供12个DDR4内存通道。英特尔在2018年超级计算大会前公布该款处理器的初始细节,以便让公众进一步了解公司在工作负载类型的深入创新。
英特尔一向注重提供工作负载优化的领先性能,Cascade Lake-AP处理器将延续英特尔的这一传统。该处理器不但可以提升核心CPU性能,在内存带宽受限的工作负载领域也居于领导地位(1)。性能预测包括:
Linpack测试性能达到英特尔至强可扩展8180处理器的1.21倍,达到AMD* EPYC* 7601的3.4倍(2)Stream Triad测试性能达到英特尔可扩展8180处理器的1.83倍,达到AMD* EPYC* 7601的1.3倍(2)产品发布时人工智能/深度学习推理测试显示,每秒处理的图像张数(2)是英特尔至强铂金处理器的17倍。
至强E-2100处理器面向中小型企业和云服务提供商。该处理器不仅支持入门级服务器的工作负载,也适用于需要针对敏感工作负载提供更强数据保护的多种计算领域。
通过部署基于英特尔至强E-2100处理器的服务器,小型企业将受益于该处理器的优化性能和数据安全性,支持最新的文件共享、存储和备份、虚拟化和员工生产力解决方案,让业务平稳运营。
采用英特尔 SGX技术,英特尔至强E-2100处理器家族的提供基于硬件的可管理性功能,可进一步保障客户数据和应用程序的安全和稳定。该功能目前是英特尔E处理器家族所独有的,采用英特尔至强E-2100处理器的新入门级服务器在与相应云应用一起使用时,能够提供一层额外的硬件增强防护。
英特尔至强E-2100处理器目前可通过英特尔和各大经销商购买。
(1) 性能领先:这是基于我们目前对2019年商用通用处理器的Linpack性能的了解所做出的判断。前所未有的内存带宽:本机DDR内存带宽。SYSmark和MobileMark等性能测试使用了特定的计算机系统、组件、软件、操作和功能。这些因素出现任何改变,都可能导致结果发生变化。您应该参照其他信息和性能测试结果,包括该产品与其他产品结合使用时的性能,从而帮助您充分评估采购计划。欲了解更多完整信息,请访问www.intel.com/benchmarks。我们的预测/模拟结果使用了英特尔内部分析或体系结构模拟或建模,仅供参考。系统硬件、软件或配置的任何差异都可能影响实际性能。
(2) 性能测试结果是基于截至2017年6月至2018年10月3日(Stream Triad)、2018年7月31日至2018年10月3日(LINPACK)以及2017年7月11日至2018年10月7日(深度学习推理)的测试和预测,可能并未体现当前公众已知的最新安全性能。
LINPACK测试:AMD EPYC 7601:配备2个AMD EPYC 7601处理器(2.2GHz, 32核)的超微电脑AS-2023US-TR4,SMT关闭,睿频加速打开,BIOS 版本1.1a,2018年4月26日,微编码:0x8001227,16x32GB DDR4-2666, 1 SSD, Ubuntu 18.04.1 LTS (4.17.0-041700-generic Retpoline),高性能Linpack v2.2,面向Linux系统的Intel(R) Parallel Studio XE 2018编译器,英特尔IMP版本18.0.0.128,AMD BLIS版本0.4.0,基准配置:Nb=232, N=168960, P=4, Q=4, Score = 1095GFs,于2018年7月31日由英特尔进行测试,与英特尔于2018年10月3日针对1个节点、双插槽、48核的Cascade Lake-AP处理器预测相比。
Stream Triad测试:1个节点、双插槽 AMD EPYC 7601(2017年6月由AMD测试),http://www.amd.com/system/files/2017-06/AMD-EPYC-SoC-Delivers-Exceptional-Results.pdf,与英特尔于2018年10月3日针对1个节点、双插槽、48核的Cascade Lake-AP处理器预测相比。
深度学习推理测试:双路英特尔 至强 铂金 8180 CPU @ 2.50 GHz(28 核),禁用超线程,禁用睿频加速,通过 intel_pstate 驱动程序扩展 governor set 到 “performance”,384GB DDR4-2666 ECC RAM。CentOS Linux 7.3.1611版(Core),Linux 内核3.10.0-514.10.2.el7.x86_64。SSD:英特尔固态盘 DC S3700 系列(800GB,2.5 英寸 SATA 6Gb/秒,25 纳米,MLC)。性能测量配置:环境变量:KMP_AFFINITY='granularity=fine, compact‘,OMP_NUM_THREADS=56,CPU 频率设置为cpupower frequency-set -d 2.5G -u 3.8G -g performance。深度学习框架Caffe:(http://github.com/intel/caffe/),修订版本号f96b759f71b2281835f690af267158b82b150b5c。推理使用 “caffe time --forward_only” 命令测量;训练使用 “caffe time” 命令测量。对于 “ConvNet” 拓扑,使用了空数据集。对于其他拓扑,在训练前数据存储在本地存储,并缓存在内存中。拓扑规范:https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50),以及https://github.com/soumith/convnet-benchmarks/tree/master/caffe/imagenet_winners(ConvNet 基准测试;文件进行了更新以使用较新的 Caffe prototxt 格式,但功能相同)。英特尔 C++ 编译器版本 17.0.2 20170213,英特尔 MKL 小型函数库版本 2018.0.20170425。Caffe 采用 “numactl -l” 运行。由英特尔于2017年7月11日测试,与英特尔于2018年10月7日针对1个节点、双插槽、48核的Cascade Lake-AP处理器预测相比。