当今世界,以算力为核心的产业数字化,正在各个行业迅猛加速。数据中心的应用也越来越广泛,这使得数据中心的负载越来越重,需要对其负载进行合理的分配和管理。

以漫长的人类历史广度为观测点,不难发现,每一轮工业革命都重新定义了社会秩序,创造了更丰富的资源体系。在大数据呈指数级爆发之下,第四次工业革命中人工智能的发展成为撬动新一轮社会秩序和生产力变革的关键。

随着数字化、智能化程度的加深,数字经济时代已悄然而至,其背后还蕴藏了不可小觑的爆发潜力。但时代的跨越并非一蹴而就,庞大数据所面临的存储、搬运、计算、通信等需求难题,是横亘于变革前夕的几座大山。

撬动这场变革的关键杠杆,则是芯片。

在今年9月的英特尔ON技术创新大会上,英特尔CEO帕特·基辛格(Pat Gelsinger)曾提出“芯经济”概念,即“在芯片和软件推动下,正在不断增长的经济形态”。“芯经济”所描绘的新时代生活方式和经济结构形态,与数字时代变革的终点不谋而合,都在为社会带来巨大的商业机遇,创造未来样式的更多可能性。

01、一款为AI加速而生的CPU,如何打破数智化转型阵痛?

实际上,数智化变革的关键,是要解决各行业数智化发展对算力指数级增长的需求。

在工业制造方面,优化生产和流通环节,降低人力成本和开销,提高良品率,是企业转型的首要突破口。AI能做的,便是帮助传统制造企业在质量监控、产量提升、 故障监控等众多场景,完成从人力密集型到技术密集型的转变,在提高生产、管理和运营效率的同时加速产业升级。

同样对数智化变革有着迫切需求的还有医疗行业,但由于大量复杂临床场景可靠数据不易获得、数据维度少且质量差、数据孤岛等问题,AI技术在医疗领域的应用进程仍举步维艰。因此,AI医疗的发展需要在降低隐私泄露风险的前提下,以更多高质量数据搭建安全可信的多源数据协同方案,提升医疗AI应用效能。

例如从2018年开始,英特尔就与宾夕法尼亚大学生物医学图像计算与分析中心一起,利用多个医疗机构确诊患者的多模式脑部扫描磁共振成像(MRI)作为数据集,在聚合服务器上迭代聚合本地训练的模型,在不共享任何患者数据的情况下,应用联邦学习方法构建一个有效的图像分割模型,并使模型为多个参与方提供服务。验证测试的结果表明,在医疗机构中使用联邦学习方法,医疗机构可以有效应对一系列因数据共享产生的安全、隐私或数据所有权问题。

归根结底,支撑各行各业解决传统业务痛点,完成数智化转型的关键,是满足业务庞大数据分析、计算和预测背后日益剧增的AI算力需求,本质上与“芯经济”的发展息息相关。

那么,“芯经济”该如何崛起?

英特尔给出的一个答案是,强化各种硬件产品的AI能力,并通过开放、多架构的软件解决方案,助力AI应用的普及。

12月15日,英特尔发布了第五代英特尔® 至强® 可扩展处理器。它主打为AI加速,每个内核均具备AI加速功能。在上一代处理器的基础上,第五代至强®️ 实现了全面的架构升级,其CPU核心数量增加至64个,相同TDP下平均性能比上一代提升21%,还拥有更大的LLC缓存和更高的内存速度,以及丰富的AI软件堆栈及生态系统支持,能够降低AI大规模部署的成本,加速AI落地与应用。

多样化的AI应用、庞大规模的云服务、步步为营的安全需求……在数据和算法无孔不入的时代下,作为一款为AI加速而生的CPU,第五代英特尔® 至强® 可扩展处理器基于其内置的丰富加速器引擎,为各行各业提供了从AI部署到落地、从应用到创新的强劲性能支持,同时还能实现降本与安全的双协同,帮助企业更好地应对变革浪潮中直击命脉的痛点,实现高效数智化转型。

02、增效:业务性价比的成倍增长与创新爆发

第五代英特尔® 至强® 可扩展处理器真正给行业变革带来的动力,有两大关键词——增效和降本,这也是数智化时代无法绕开的核心议题。

芯片制造商和科技公司一直在寻找提升AI应用效率的方法。作为基础算力输出者和应用性能加速器,英特尔相信:充分利用现阶段应用部署最为广泛的CPU资源,是在AI应用规模化部署和实践上高效且行之有效的路径之一。

2017年,第一代至强®️ 可扩展处理器内置了英特尔®️ AVX-512,成功对AI工作负载进行加速;2018年,第二代至强®️ 开始采用深度学习加速(DL Boost)技术;2020年,面向多路服务器的第三代至强®️ 可扩展处理器通过扩展出bfloat16加速功能,在推理加速能力之外又加强了训练能力;而第四代英特尔®️ 至强®️ 则带来了全新的加速引擎——英特尔®️ AMX,进一步提升深度学习训练和推理性能,同时更适合自然语言处理(NLP)、推荐系统和图像识别等工作负载。

英特尔通过对不同代际至强®️ 可扩展处理器中内置的AI加速能力的优化,使企业可以充分利用部署更为广泛的、基于CPU的IT基础设施和架构,对于有多元需求的行业也可以更灵活地兼顾常规通用算力和针对特定场景的AI应用,更有利于达成降本增效的目标。

英特尔® AVX-512和英特尔®️ AMX同样内置于第五代至强®️ 可扩展处理器中,不仅能实现传统企业AI应用的落地和加速,更使其机器学习、深度学习的性能大幅提升,在大模型上也能有出色表现。

据了解,11.11期间,在京东用户访问峰值同比大幅提升、智能客服咨询服务量暴涨的情况下,京东云通过部署基于第五代英特尔® 至强® 可扩展处理器的新一代服务器, 大幅提升了整机性能、AI计算机视觉推理性能以及Llama v2推理性能,高效服务了数百个AI场景和36万商家。

不仅是AI推理加速,通过内置的英特尔® SGX、TDX双安全引擎,第五代至强®️ 可扩展处理器还可实现应用级和虚拟机级双隔离。基于第五代英特尔®️ 至强®️ 可扩展处理器及英特尔®️ AMX、英特尔®️ TDX加速引擎,阿里云打造“生成式AI模型及数据保护“的创新实践,实现数据在使用、存储和传输的全流程保护,使第8代ECS实例在安全性和AI性能上都获得显著提升,且保持实例价格不变,普惠客户。

第五代至强® 可扩展处理器可以为各种工作负载加速。

通过英特尔® AMX,生成式AI更易于在CPU上运行,通过在自然语言处理推理方面的性能飞跃,它能更好地帮助企业高效运行智能助手、聊天机器人、预测性文本、语言翻译等工作负载;针对Web和微服务,第五代至强® 可扩展处理器能为搜索、社交媒体、电子商务、媒体及其他数字化服务带来更低的成本和更优的性能;而在数据库和数据分析方面,五代至强® 通过更大的三级缓存、更快的内存和英特尔® 数据分析引擎,可以高速运行 CRM、ERP 及其他数据库和数据分析应用,更快获取洞察并提升生产力。

据悉,火山引擎即将全系规格支持第五代英特尔® 至强® 可扩展处理器,其全新升级的第三代弹性计算实例,在第五代至强® 的算力加持下,能够实现整机算力和应用性能的大幅提升。同时,火山引擎通过独有的潮汐资源并池能力,构建百万核级别弹性资源池,用近似包月成本提供按量使用体验,降低上云成本。

产品组合创新亦是成倍提高业务效率的重要途径之一。

在CPU之外,英特尔还拥有数据中心级GPU和AI专用加速器等不同硬件产品,以更好地拓展各类工作负载所需的算力及性能边界,实现更全面化的业务提升。

不仅如此,英特尔还提供了一整套由高级编译器、库以及分析、调试和移植工具组成的英特尔® 软件开发工具,它和经优化的AI框架均面向英特尔® 架构优化,能够让科学家、AI研究员和开发者们更轻松地优化包括内置加速器在内的诸多功能特性;还能让开发人员能够在不同硬件架构和供应商之间自由迁移代码,实现更高效的端到端解决方案。

03、加速器助力能效提升,业务转型成本的“降压药”

降本是第五代英特尔® 至强® 可扩展处理器为行业数智化变革提供的另一大助力。随着工作负载的日渐增长,企业亟需找到软硬件性能提高与成本之间的平衡点。

例如在交通行业,正是借助AI、大数据、云计算、互联网等前沿IT技术,以更细的颗粒度去推进各个流程的优化,实现全方位的降本增效。其中,由AI驱动的交通流量预测系统,能够根据海量数据建模实时预测未来路况,再通过动态控制交通信号、交通运输路线优化等方法,缓解高峰期交通压力;AI技术与交通监控系统的结合,不仅能通过图像自动分析技术,自动监控道路交通事件,还能根据车流量、车速、车型、突发事件紧急程度进行预测分析,为道路安全运行与危险情况营救提供必要的数据支持。

而这所有AI交通系统和解决方案运转的背后,都需要海量数据与强大算力作为支撑,后续的维护和运营成本亦不可小觑。

对此,第五代至强® 可扩展处理器的解法是提升能效,降低成本。在其上使用内置加速器,可将目标工作负载的每瓦性能提升高达10倍。同时相比于第一代至强® ,第五代至强® 能够减少高达77%的TCO。凭借更高的单核性能和内置的众多加速器引擎,它还能够帮助各行业企业在保证算力性能的基础上,降低功耗和运营成本,实现可持续发展。

值得一提的是,第五代至强® 可扩展处理器设计了优化的电源模式,在对大多数工作负载的性能几乎没有影响的情况下,减少系统利用率不高时系统部分的空转程度,从而提高轻度及中度载荷下的电源效率,帮助企业减少本地或云端碳足迹。同时,它还拥有高能效SKU,以能耗低至105W且已针对工作负载优化的SKU扩展算力,满足工作负载的要求。

在部署成本方面,第五代至强® 可扩展处理器的软件和引脚与上一代处理器兼容,大大简化了用户从上一代处理器的升级成本,减轻测试和验证工作。

综合来看,在数字时代和“芯经济”快速发展的当下,第五代英特尔® 至强® 可扩展处理器的诞生,再次验证了在各行业数智化探索的过程中,CPU在AI加速方面展现出的澎湃性能潜力和优势。

一方面,第五代英特尔® 至强® 可扩展处理器用于AI加速工作负载的代际提升性价比高;另一方面,它可以覆盖从数据预处理、训练、推理的整个AI管线,实现端到端的AI加速。更重要的是,广泛且规模庞大的x86 CPU生态系统,为极速爆发的AI业务转型和迭代需求提供了不可小觑的原生态优势。基于英特尔® 至强® 可扩展处理器带来的“芯经济”强劲发展势头,或许将在数字化时代重塑AI算力的格局。

结语:

AI,正重新定义未来的可能性。

“罗马并非一日建成”,数字经济时代爆发与产业变革并非一朝一夕之事,其带来的巨大变革在重新定义社会秩序,带来更丰富资源体系的同时,也带来了象征着时代变革的产业阵痛。

破解之法无他,算力是第一要义。算力的不断跃升,带来最直接的价值无疑是提高业务转型性价比,拥有与世界快速变化相匹配的生产能力,亦拥有为未来理想世界投票的能力。

而算力之上,是随之而来的“芯经济”浪潮。在推动数字化转型的过程中,“芯经济”发展的推力不仅仅来源于硬件本身,更是从基础架构到数据库与操作系统,再到上层应用的全栈支持,是百花齐放的软件生态协力,才能充分释放底层硬件特性,为变革带来更深度的AI优化与算力潜能。

恰好,长期以来,英特尔也一直基于CPU产品,不断强化与本土软件合作伙伴的深度协作,以全栈生态加速AI在中国产业的落地与普及。

面向新信息时代的黎明,英特尔向往的是更崭新的未来。在奔赴这个未来的进程中,英特尔也将以更差异化、更个性化、更高效的产品迭代,为AI未来全面加速。