在400G阶段,提升速率的同时,功耗和成本问题愈发突出。以光模块为例,作为光网络的关键器件,其功耗和价格直接影响用户购买意愿。从10G到400G,光模块的功耗猛增,导致整机功耗极高,给数据中心带来巨大压力。
为解决这一问题,业界提出了多种方案,其中CPO和LPO备受关注。LPO(Linear-drive Pluggable Optics)强调可插拔性,采用线性直接驱动技术,取消了DSP(数字信号处理)芯片,从而降低功耗和成本。相比CPO,LPO在维护和部署上更具优势。
LPO的优势主要体现在低功耗、低成本、低延迟和易于维护。取消DSP芯片后,光模块的功耗显著下降,成本也随之降低。同时,减少数据处理步骤,降低了延迟,特别适合AI计算和超级计算场景。此外,LPO支持热插拔,简化了光纤布线和设备维护,使用更加方便。
尽管如此,LPO也面临一些挑战。由于去除了DSP,系统的误码率增加,传输距离受限,更适合短距离应用场景。此外,LPO的标准化仍在早期阶段,互操作性存在挑战,企业需具备一定技术能力才能有效应用。
尽管存在挑战,LPO的前景依然光明。不少光通信巨头已投入研发,市场主要客户也表现出浓厚兴趣。预计未来几年,LPO将在数据中心光网络中占据重要地位。
总之,LPO作为一种平衡与妥协的技术,虽略有性能损失,但在降低功耗、成本和延迟方面表现出色。随着技术不断成熟,LPO有望成为800G时代的核心技术之一,助力数据中心光网络迈向新高度。
近年来,光通信产业发展迅速。在5G和人工智能的推动下,光通信技术取得了巨大突破,光基础设施也实现了质的飞跃。尤其是今年AIGC大模型流行,智能计算、超级计算兴起,带动了光通信新一波发展热潮。骨干网400G即将全面部署,数据中心800G、1.6T也跃跃欲试。
光通信演进的挑战
事实上,光通信的技术迭代并不是简单的数字翻倍。
进入400G阶段后,我们要解决的不仅仅是速率的提升,还要解决高速率带来的功耗和成本问题。速度的提高就像卡车送货一样。当货物越来越重时,就需要升级发动机。发动机排量越大,油耗越高,发动机价格和燃油成本也会增加。
我们以光模块为例。
光模块作为光网络的关键器件和使用量最大的器件,一直以来都是业界关注的焦点。其功耗和价格与用户购买意愿密切相关。
早在2007年,10G(10Gbps)光模块的功率仅为1W左右。
到了40G、100G、400G、800G,光模块的功耗猛增,达到了30W。
重要的是要认识到一台交换机可以有多个光学模块。如果满载的话,往往有几十个光模块(如果有48个的话,就是48×30=1440W)。
一般来说,光模块的功耗约占整机功耗的40%以上。这意味着整机功耗极有可能超过3000W。
光通信设备能耗的激增也给整个数据中心的能耗和成本带来巨大压力,这对通信网络的碳达峰和碳中和目标极为不利。
与2010年相比,光器件的能耗将增加26倍。
为了解决光通信速率不断上升带来的能耗问题,业界进行了大量的技术探索。
去年流行的CPO就是解决方案之一。今年,除了CPO之外,业界还提出了一个新方案——LPO。
什么是LPO?
LPO,英文全称为Linear-drive Pluggable Optics。
从名字上就可以看出,它是一种光模块封装技术。
如下图所示,交换机上有光模块端口,将对应的光模块插入其中,然后即可插接光纤。如果坏了,也可以更换。
LPO强调“可插拔”,是为了与CPO方案中光模块不可插拔的区别。将光模块(光引擎)移近交换芯片,直接与其“捆绑”在一起。
LPO 与传统光模块的主要区别在于线性驱动。
所谓“线性驱动”是指LPO采用线性直接驱动技术,光模块中取消了DSP(数字信号处理)/CDR(时钟数据恢复)芯片。
那么什么是线性直驱,DSP的作用是什么,为什么可以取消呢?为什么可以取消呢?拆除后有何影响?
我们先从光模块的基本架构开始。
光模块传输,即电信号转变为光信号,光信号转变为电信号的过程。
在发送端,信号经过数模转换器 (DAC),将其从数字信号变为模拟信号。在接收端,模拟信号经过模数转换(ADC)并再次变为数字。
经过一番运算后,得到的数字信号有点杂乱、失真。这时,就需要DSP,对数字信号进行“修复”。
DSP是运行算法的芯片。它具有数字时钟恢复功能和色散补偿功能(去除噪声、非线性干扰等因素),可以对抗和补偿失真,减少失真对系统误码率的影响。
(注:并非所有传统光模块都有DSP,但在高速光模块中,信号要求较高,所以基本都需要DSP。)
除DSP外,光模块中的主要电气芯片还包括激光驱动器(LDD)、跨阻放大器(TIA)、限幅放大器(LA)以及时钟和数据恢复芯片(CDR)。
CDR也用于数据恢复。它从接收到的信号中提取数据序列,并恢复出与数据序列对应的时钟时序信号,从而恢复接收到的特定信息。
DSP的功能非常强大。但它也存在功耗和成本较高的问题。
例如,在400G光模块中,采用的7nm DSP,功耗约为4W,约占整个模块功耗的50%。
从成本角度来看,400G光模块中DSP的BOM(物料清单)成本约占20-40%。
LPO方案是将光模块中的DSP/CDR芯片取出,将相关功能集成到设备侧的交换芯片中。
光模块中只留下了线性度较高的Driver(驱动芯片)和TIA(Trans-Impedance Amplifier),分别集成了CTLE(连续时间线性均衡)和EQ(Equalization,均衡)功能,用于补偿高线性度-速度信号在一定程度上。集成了均衡)功能,对高速信号进行一定程度的补偿。
LPO的优势
LPO的优点概括为低功耗、低成本、低延迟和易于维护。
低功耗
没有DSP,功耗肯定会下降。
根据Macom的数据,带有DSP功能的800G多模光模块的功耗可以超过13W,而采用MACOM PURE DRIVE技术的800G多模光模块的功耗小于4W。
低成本
这是不言而喻的。前面提到DSP的BOM成本约占20-40%,被淘汰。驱动器和TIA集成EQ,成本略有增加,但总体成本还是降低了。据业内人士分析:一个800G光模块中,BOM成本约为600-700美元,DSP芯片成本约为50-70美元。驱动器和TIA集成EQ功能,成本增加3-5美元。这样算下来,系统总成本可降低约8%,约50-60美元。值得一提的是,DSP也是Broadcom、Inphi等少数厂商掌握的技术。取消DSP也在一定程度上减少了对少数厂商的依赖。
低延迟
没有DSP,减少了一个处理步骤,数据传输延迟也减少了。这一优势对于AI计算和超级计算场景尤为重要。
维护方便
这是相对于CPO方案而言的。在CPO方案中,如果系统中任何一个设备出现故障,就必须断电并更换整个单板,维护起来非常不方便。LPO的封装没有明显变化,支持热插拔,简化光纤布线和设备维护,使用更方便。
LPO 当前的挑战
通讯距离短
移除 DSP 是要付出代价的。TIA和驱动芯片并不能完全取代DSP,因此系统的误码率会增加。误码率越高,传输距离自然就会越短。业界普遍认为LPO只适合特定的短距离应用场景。例如,数据中心机柜内的服务器和交换机之间的连接,以及数据中心机柜之间的连接。LPO的初步发展可以连接距离从几米到几十米。未来可能会延伸到500米以内。
标准化才刚刚开始
目前,LPO的标准化仍处于早期阶段,互操作性方面可能存在一些挑战。对于企业来说,如果采用LPO,需要具备一定的技术能力,能够制定技术规范和解决方案,能够探索设备和模块的边界条件,能够进行大量的集成和互操作测试。
也就是说,LPO目前更适合相对封闭、单一供应商的系统。如果采用多个供应商,又没有实力控制,可能会出现“问题难以界定、相互推卸”等问题,这比采用传统DSP解决方案更糟糕。
此外,有专家指出,LPO给系统侧的电通道设计带来了一些挑战。目前SerDes的主流规格是112G,很快就会升级到224G。专家认为LPO无法满足224G SerDes的要求。
LPO产业化进展
LPO解决方案实际上之前已经有一些公司提出过,但由于技术限制并没有取得任何成果。在今年的OFC大会上,LPO再次被提出,很快成为业界关注的焦点。
AWS、Meta、微软、谷歌等国际市场主要客户均表达了对LPO的兴趣。不少光通信巨头也投入资源进行研发。目前,FiberMall已推出800G LPO解决方案。
近期部分企业应该已经实现小规模出货。LPO解决方案的关键在于芯片。高线性TIA&Driver的主要供应商有Macom、Semtech、Maxliner等。
据预测,LPO将在2024年实现大规模商业化。业内较为乐观的机构认为LPO未来可以占据一半的市场份额。较为保守的机构认为,到2026年,CPO/LPO的占比将达到30%左右。
结论
LPO是一种平衡与妥协的技术。它适应特定的应用场景(短距离),放弃了DSP/CDR,导致性能(误码率)略有损失。然而,它也降低了功耗、成本和延迟。它与 CPO 相比具有不同的优点和缺点。虽然它比CPO出现得晚,但它的部署会比CPO更快。
按照目前的趋势,LPO将是800G时代最具潜力的技术路径。随着AIGC浪潮的推进,数据中心光网络将向800G迈进。LPO的黄金时代即将到来。
本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时处理。
汇鑫科服隶属于北京通忆汇鑫科技有限公司, 成立于2007年,是一家互联网+、物联网、人工智能、大数据技术应用公司,专注于楼宇提供智能化产品与服务。致力服务写字楼内发展中的中小企业 ,2009年首创楼宇通信BOO模式,以驻地网运营模式为楼宇提供配套运营服务;汇鑫科服始终以客户管理效率为导向,一站式 ICT服务平台,提升写字楼办公场景的办公效率和体验;