英特尔的OCI(光学计算互连)芯粒有望革新面向AI基础设施的高速数据处理。

英特尔在用于高速数据传输的硅光集成技术上取得了突破性进展。在2024年光纤通信大会(OFC)上,英特尔硅光集成解决方案(IPS)团队展示了业界领先的、完全集成的OCI(光学计算互连)芯粒,该芯粒与英特尔CPU封装在一起,运行真实数据。面向数据中心和HPC应用,英特尔打造的OCI芯粒在新兴AI基础设施中实现了光学I/O(输入/输出)共封装,从而推动了高带宽互连技术创新。

英特尔硅光集成解决方案团队产品管理与战略高级总监Thomas Liljeberg表示:“服务器之间的数据传输正在不断增加,当今的数据中心基础设施难堪重负。目前的解决方案正在迅速接近电气I/O性能的实际极限。然而,借助英特尔的这项突破性进展,客户能够将硅光共封互连方案无缝集成到下一代计算系统中。英特尔的OCI芯粒大大提高了带宽、降低了功耗并延长了传输距离,有助于加速机器学习工作负载,进而推动高性能AI基础设施创新。”

该OCI芯粒可在最长可达100米的光纤上,单向支持64个32Gbps 通道,有望满足AI基础设施日益增长的对更高带宽、更低功耗和更长传输距离的需求。它将有助于实现可扩展的CPU和GPU集群连接,和包括一致性内存扩展及资源解聚的新型计算架构。

AI应用正在全球范围内被越来越多地部署,近期大语言模型和生成式AI的发展正在加速这一趋势。对AI负载加速新需求而言,更大、更高效的机器学习模型将发挥关键作用。未来的计算平台需要面向AI实现扩展,因而需要指数级提升的I/O带宽和更长的传输距离,以支持更大规模的处理器(CPU、GPU和IPU)集群,和资源利用更高效的架构,如xPU解聚和内存池化(memory pooling)。

电气I/O(即铜迹线连接)带宽密度高且功耗低,但传输距离短至不超一米。数据中心和早期AI集群中使用的可插拔光收发器模块可以延长传输距离,但就AI工作负载的扩展需求而言,其成本和功耗不可持续。xPU光电共封I/O解决方案 可以在提高能效比、降低延迟和延长传输距离的同时,支持更高的带宽,从而满足AI和机器学习基础设施的扩展需求。

打个比方,在CPU和GPU中,用光学I/O取代电气I/O进行数据传输,就好比从使用马车(容量和距离有限)到使用小汽车和卡车来配送货物(数量更大、距离更远)。英特尔的OCI芯粒等光学 I/O 解决方案,在性能和能耗方面实现了这一水平的提升,从而有助于AI的扩展。

image.png

英特尔OCI(光学计算互连)芯粒

在完全集成的OCI芯粒中,英特尔利用了已实际验证的硅光子技术,集成了包含片上激光器的硅光子集成电路(PIC)、光放大器和电子集成电路。在2024年光纤通信大会上,英特尔展示了与自家CPU封装在一起的OCI芯粒,但它也能与下一代CPU、GPU、IPU等SOC(系统级芯片)集成。

这一完全集成的OCI芯粒的双向数据传输速度达4 Tbps,并兼容第五代PCIe。在2024年光纤通信大会现场,实时光学链路演示展示了通过单模光纤(SMF)跳线(patch cord)在两个CPU平台之间实现的发射器(Tx)和接收器(Rx)互连。CPU生成并测量了比特误码率(BER)。英特尔还展示了发射器的光谱(optical spectrum),包括单一光纤上200GHz间隔的八个波长,以及32Gbps发射器眼图(eye diagram),表明信号质量很强。

该芯粒目前单向支持64个32Gbps 通道,传输距离达100米(由于传输延迟,实际应用中距离可能仅限几十米)。它采用8对光纤,每根8波长密集波分复用(DWDM)。这种共封装解决方案也非常节能,功耗仅为每比特5皮焦耳(pJ),而可插拔光收发器模块的功耗大约为每比特15皮焦耳。对数据中心和HPC环境而言,超高的能效十分重要,有助于解决AI应用的高能耗问题,提高可持续性。

英特尔研究院在硅光子领域已深耕超过25年,是硅光集成的开拓者和领导者。英特尔在业内率先开发并向大型云服务提供商批量交付硅光子连接器件,这些产品具有领先的可靠性。

英特尔的主要差异化优势在于其直接集成技术,结合晶圆上激光器混合集成技术,可提高良率并降低成本。这一独特的方法使英特尔能够在实现卓越性能的同时保持高能效比。依托强大的量产平台,英特尔已出货超过800万个硅光子集成电路,包含多达3200万个片上集成激光器,时基故障率(FIT)小于0.1。时基故障率是一种广泛使用的测量可靠性的方法,体现了故障率和发生故障的次数。

这些硅光子集成电路被封装在可插拔收发器模块中,部署于超大规模云服务提供商的大型数据中心网络中,用于传输速率需求高达100、200和400 Gbps的应用。面向传输速率需求达800 Gbps和1.6 Tbps的新兴应用,速度达200G/通道的硅光子集成电路正在开发中。

英特尔还正在探索新的硅光子制造工艺节点,该节点具有先进的器件性能、更高的密度、更好的耦合性,并能大幅提高经济性。英特尔将继续在片上激光器和性能、成本(芯片面积减少 40% 以上)和功耗(减少 15% 以上)等方面取得进步。

英特尔研发的OCI芯粒目前尚处于技术原型(prototype)阶段。英特尔正在与客户合作,开发共封OCI和客户SoC,作为光学I/O的解决方案。

英特尔的OCI芯粒推动了高速数据传输技术的进步。随着AI基础设施的不断发展,英特尔将继续推动前沿技术创新,探索面向未来的连接技术。