marvell最新推出了新一代的arm服务器芯片thunder x3,使用台积电7nm工艺制造,核心数量达到96核,同时继续支持四线程,ipc性能比thunderx2提升超过25%,是一次全面的革新与巨大的提升。
在半导体领域,marvell(美满电子)公司略显低调,但又是那种遮不住光芒的实力型公司。marvell成立于1995年,目前全球员工数量超过5000名,核心业务主要聚焦在基础设施半导体方案,包括存储、网络、计算三大领域,2020财年总收入高达27亿美元。
mavell旗下拥有完整的cpu产品线,包括armada、octeon tx、thunderx等多种类型的处理器。2017年mavell收购了cavium(凯为半导体)公司,cavium此前拥有15年以上的高性能计算多核cpu的技术积累,在基于arm架构的嵌入式服务器领域经验丰富,这帮助marvell公司在该领域继续保持领先。
目前,marvell已为客户交付上亿颗cpu芯片,旗下基于arm架构的服务器处理器thunderx在全球获得广泛部署,marvell已经成为全球最大的arm服务器处理器供应商。
前不久,marvell推出了新一代的arm服务器芯片thunder x3,不仅使用了更先进的台积电7nm工艺制造,升级为arm v8.3指令集,核心数量也达到了惊人的96核,同时继续支持四线程,带来可观的性能提升,令业界瞩目。
近日我们与marvell半导体公司副总裁及服务器处理器部总经理gopal hegde以及marvell半导体公司服务器处理器部产品营销高级总监周立新进行了在线访谈,就thunder x3的产品信息以及marvell在arm服务市场方面的布局进行了交流。
·应用场景发生变化 arm服务器工艺制程已经领先
在服务器领域,尤其是大规模数据中心市场,基于x86架构的处理器长久以来都占据绝对优势,但近年来随着云计算等应用的不断变化,基于arm架构的服务器逐渐受到客户的青睐。
marvell公司服务器处理器事业部产品营销高级总监周立新说到,“十几年前,数据中心的规模还比较小,用户数量相对来说比较少。传统的业务模式对cpu的要求只聚焦在单线程性能上,对于并行业务的要求不高。现在,除了继续强调单线程性能,同时还要强调并行处理能力,这点在今天尤为重要。而且由于数据中心的规模越来越大,很多客户都需要成本最低的解决方案,对成本、功耗非常敏感,这也是他们对arm这样低功耗、低成本处理器感兴趣的原因。”
“另外,现在已经不是一个架构解决所有问题的时代。随着gpu、异构计算架构不断涌现,客户对基于arm架构的服务器处理器的兴趣也是越来越高。之前传统的软件有很多都是由第三方提供的,比如oracle提供数据库,很多客户没有源代码。但现在不一样,一些超大规模数据中心的工作负载、应用都是有源代码的,所以能够很快的解决问题,而且还允许改变源代码、改变程序来加速创新能力。这也对arm服务器的引入带来方便,可以更轻松应对兼容性问题。”周立新说到。
“在x86架构几十年的历史中,它的单个cpu核心既要解决服务器市场的需求,也要解决笔记本市场需求,相当于一个架构要解决很多问题,并没有针对特定的应用有所优化。而arm服务不同,它是专门为服务器所做的,不需要支持消费级产品,所以可以实现高度优化的方案。”
周立新还说:“另外,与x86相比,arm服务在制程工艺方面已经领先。例如,英特尔虽然有自己的晶圆厂,但今天量产的仍然是14nm产品,而marvell是tmsc台积电代工的7nm,整整领先了两代。而amd的rome还是非常成功的,但在架构方面采用chiplets设计,虽然核心数量多,但不是放在一个die上面做,die与die之间就会存在延迟、带宽方面的限制。而marvell的arm处理器单核面积与amd、intel相比小了许多,集成度更高,功耗、性能也比他们更强。”
·96核心thunderx3性能大幅提升 并行计算优势明显
marvell thunderx3处理器采用台积电(tsmc)7nm制程工艺制造,拥有高达96个核,每个核心4个线程,每个插槽的总计算能力达到384线程。内存接口支持8通道ddr4-3200,每个通道可搭载2个dimm。io扩展方面提供了64个pcie gen 4.0通道,搭载 16个控制器。
marvell thunder x3相比thunder x2性能大幅提升
marvell官方表示,thunderx3微架构的改进使得ipc性能比thunderx2提升超过25%,结合处理器频率和ddr频率的提升,单线程性能提升超过60%,单个插槽整数运算性能提升最多3倍。在浮点运算方面,thunderx3的每个核心搭载四个128位simd (neon) 单元,相比thunderx2翻倍,因此性能可以增加5倍多。因此,thunderx3相比thunderx2可以说是全面的革新与巨大的提升。
关于单核四线程相比单线程的优势,周立新进一步说到:“我们从3个标准来看,一是speccpu,这是一个标准的衡量服务器的指标;第二是mysql,大家都很熟悉的数据库;第三是web搜索。从性能上看,在这三个应用中四个线程开了以后跟单线程比,都有明显提升,尤其在mysql当中最高可以提高80%。所以,四线程对性能提升还是非常显著的,从这点来看,thunderx3的性能有着比较大的领先。”
thunder x3的主要规格
“marvell的arm服务器处理器主要聚焦超算、云端计算和原生arm应用这几个方面,这些应用场景大多要求高度并行、i/o密集、延迟敏感以及arm原生(移动工作负载)。thunderx3的目标工作负载(如大数据、数据库、流媒体、web 层、弹性搜索和云存储)其本质上是高度并行。例如,thunderx3的96颗核心最多可以支持384个线程,每个线程就可以作为一个操作系统运行一个虚拟机,这样一个芯片就可以支持384个虚机。在“安卓云”的部署中,需要边缘设备做加速、做cdn,此时thunderx3的并行计算优势就体现出来了。”gopal hegde在访谈中这样说到。
“thunderx3服务器非常适合在云端或边缘以容器或虚拟机的形式运行当前部署在手机和arm终端上的原生arm应用程序。这使得各种新兴的应用有机会成为现实,包括android云游戏、云端android和arm软件/应用程序开发。由于很多app就是为了arm开发的,所以相比x86架构我们更有优势。”周立新说。
还有arm native,国内主要是安卓云的业务。marvell目前已经有了相应的解决方案,不仅能提供硬件设备,还可以提供包括软件在内的整套解决方案。
“另外,与云计算类似,超算任务也有很多都是并行的应用,包括天气预测、能源行业等等。所以多核、多线程是非常适合这些场景。然后超算里面还有很重要一点,就是对内存带宽、延时的要求非常高,同时超算的部署密度非常高,所以对功耗要求也很敏感,arm处理器在这些方面也具有明显优势。在很多实验室、oil gas、cae、genomics、eda等行业,我们都找到了适用性非常强,且与x86相比有着明显竞争优势的方案。”周立新说。
·完整生态支持 arm服务器增长潜力巨大
要知道服务器市场是一个跟生态密切相关的业务,终端芯片只是一部分,客户需要的是从芯片、操作系统、到应用层等一整套的解决方案。任何一个服务器包括x86,都不是独立运作的,都需要系统厂商以及各种各样的硬体配合,包括memory、hba等很多外设,还有操作系统、应用软件等一系列的支持,这样的业态才会成功。
周立新说:“marvell目前已经有超过100个生态伙伴,从系统厂商到硬件的外设,从软件到操作系统os,以及中间的middleware,这对我们而言非常重要,我们也很高兴看到arm服务器生态还在持续成长。
周立新在提到marvell在arm服务器领域所取得的成就时非常自豪,他表示:“五年前,我们只有三四个生态伙伴,刚开始是非常艰难的。过去两年,thunderx2已经广泛部署在了云计算和hpc市场,主要客户包括microsoft azure、桑迪亚国家实验室中的 500强超级计算机astra、美国能源部的国家实验室、英国莱斯特大学等等。”
微软公司microsoft azure资深工程师leendert van doorn博士曾表示:“微软project olympus云硬件与marvell thunderx2服务器处理器的结合是一个里程碑,提升了azure云基础设施中arm64产品的开发能力。微软致力于推动平台创新,我们对处理器架构的进一步支持是我们践行行业领导力与最佳实践的一部分。与marvell和鸿佰科技的合作为我们的内部使用带来了最完整、性能最强的arm服务器解决方案。”
gopal hegde说:“thunderx2已经成为世界上应用最广泛的基于arm架构的服务器处理器,而且是被一些业务规模非常大的客户所证明。我们刚才提到的包括美国和欧洲的超算实验室,业务要求都是非常高的,我们在实践中都已经证明。thunderx3的性能比thunderx2有更大的提升,目前公开的二十几个使用thunderx2处理器的客户,已经表示将会继续升级至thunderx3。”
三年前arm曾经有过预测,大概在2020~2022年的时候,全球大概会有20%左右的服务器将是基于arm架构运行的。近年来,包括ampere、华为等数家厂商纷纷发力arm服务器市场,也充分说明arm生态的巨大潜力,arm加速应用的时机逐渐成熟,生机勃勃的春天已经到来。
作者:单亚凯来源:电脑之家