一文读懂光通信:什么是LPO?

那么,LPO和传统光模块的关键区别,就在于线性驱动(Linear-drive)了。

所谓“线性驱动”,是指LPO采用了线性直驱技术,光模块中取消了DSP(数字信号处理)/CDR(时钟数据恢复)芯片。

DSP的各种补偿和估算

DSP各模块的作用

(注意:DSP这个东西,也不是所有的传统光模块都有。

光模块的功耗组成

从成本的角度来看,400G光模块中,DSP的BOM(Bill。

大家好,我是小枣君。

今天这篇文章,我们来聊一个最近非常火的光通信概念——LPO。

近年来,光通信产业的发展势头很猛。

在5G、宽带中国、东数西算等国家战略的持续刺激下,国内光通信技术取得了巨大突破,光基础设施也有了质的飞跃。

特别是今年,AIGC大模型爆火,智算和超算崛起,更是带动了光通信的新一波发展热潮。骨干网400G即将全面落地,数据中心800G和1.6T也跃跃欲试。

OSPF的演进(来源:Arista Network)

光通信演进的挑战

其实,光通信的技术迭代,并不是简单的数字翻倍。

进入400G阶段后,我们要解决的问题,不仅仅是速率的提升,更包括高速率所带来的功耗和成本问题。

速率提升就像汽车运货。当运载的货物越来越重,就需要升级发动机。而发动机的排量越大,油耗就越大,发动机价格和油费也会越多。

我们就以光模块为例。

作为光网络的关键器件,也是用得最多的器件,光模块一直以来都是行业关注的焦点。它的功耗和价格,和用户采购意愿息息相关。

早在2007年的时候,一个万兆(10Gbps)的光模块,功率才1W左右。

随着40G、100G、400G、800G的迭代,光模块的功耗一路飙升,直逼30W。

要知道,一个交换机可不止一个光模块。满载的话,往往就有几十个光模块(假如有48个,就是48×30=1440W)

一般来说,光模块的功耗大约占整机功耗的40%以上。这就意味着,整机的功耗极大可能会超过3000W。

光通信设备的能耗激增,也给整个数据中心的能耗及成本带来了巨大的压力,极不利于通信网络的双碳目标。

相比2010年,光器件能耗将增加26倍。(图片来自思科)

为了解决光通信速率攀升带来的能耗问题,行业进行了大量的技术探索。

去年很火的CPO,就是解决方案之一。

CPO我之前专门进行过介绍(《到底什么是NPO/CPO?》),这里就不再详细讲了。

今年,在CPO之外,行业又提出了一个新方案,这就是——LPO。

什么是LPO

LPO,英文全称叫Linear-drive Pluggable Optics,即线性驱动可插拔光模块。

从名字可以看出,它是一种光模块封装技术。

所谓“可插拔(Pluggable)”,我们平时看到的光模块,都是可插拔的。

如下图所示,交换机上有光模块的端口,把对应的光模块插进去,就能插光纤了。如果坏了,也可以换。

LPO强调“可插拔”,是为了和CPO方案相区分。CPO方案里,光模块是不可以插拔的。光模块(光引擎)被移动到了距离交换芯片更近的位置,直接“绑”在一起了。

那么,LPO和传统光模块的关键区别,就在于线性驱动(Linear-drive)了。

所谓“线性驱动”,是指LPO采用了线性直驱技术,光模块中取消了DSP(数字信号处理)/CDR(时钟数据恢复)芯片。

问题来了——什么是线性直驱呢?DSP发挥什么作用?为什么可以被取消?取消之后,会带来什么影响?

这里,我们还是先从光模块的基本架构开始讲起。

在之前介绍相干光技术的时候,小枣君提到过,光模块传输,就是电信号变成光信号,光信号又变成电信号的过程。

在发送端,信号经过数模转换(DAC),从数字信号变成模拟信号。在接收端,模拟信号经过模数转换(ADC),又变成数字信号。

一顿操作下来,得到的数字信号就有点乱,有点失真。这时候,需要DSP,对数字信号进行“修复”。

DSP就是一个跑算法的芯片。它拥有数字时钟恢复功能、色散补偿功能(去除噪声、非线性干扰等因素影响),可以对抗和补偿失真,降低失真对系统误码率的影响。

DSP的各种补偿和估算

DSP各模块的作用

(注意:DSP这个东西,也不是所有的传统光模块都有。但是,在高速光模块中,对信号要求高,所以基本需要DSP。)

除了DSP之外,光模块中主要的电芯片还包括激光驱动器(LDD)、跨阻放大器(TIA)、限幅放大器(LA)、时钟数据恢复芯片(CDR,Clock and Data Recovery)等。

CDR也是用于数据还原。它从接收到的信号中提取出数据序列,并且恢复出与数据序列相对应的时钟时序信号,从而还原接收到的具体信息。

DSP的功能很强大。但是,它的功耗和成本也很高。

例如,在400G光模块中,用到的7nm DSP,功耗约为4W,占到了整个模块功耗的50%左右。

光模块的功耗组成

从成本的角度来看,400G光模块中,DSP的BOM(Bill of Materials,物料清单)成本约占20-40%。

LPO方案,就是把光模块中的DSP/CDR芯片干掉,将相关功能集成到设备侧的交换芯片中。

光模块中,只留下具有高线性度的Driver(驱动芯片)和TIA(Trans-Impedance Amplifier,跨阻放大器),并分别集成CTLE(Continuous Time Linear Equalization,连续时间线性均衡)和EQ(Equalization,均衡)功能,用于对高速信号进行一定程度的补偿。

如下图所示:

LPO的优点

LPO的优点,归纳来说,就是:低功耗、低成本、低延时、易维护。

低功耗

没有了DSP,功耗肯定是下降了。

根据Macom的数据,具有DSP功能的800G多模光模块的功耗可超过13W,而利用MACOM PURE DRIVE技术的800G多模光模块功耗低于4W。

低成本

这个也不用说了。前面提到DSP的BOM成本约占20-40%,这个就没有了。

Driver和TIA集成了EQ,成本略有增加,但整体还是下降的。

有业界机构分析:800G光模块中,BOM成本约为600~700美金,DSP芯片的成本约为50~70美金。Driver和TIA里集成了EQ功能,成本会增加3~5美金。算下来,系统总成本可以下降大约8%,大约50~60美金。

值得一提的是,DSP也是博通、Inphi等少数厂商所掌握的技术。取消了DSP,从某种程度上来说,也减少了对少数厂商的依赖。

低时延

没有了DSP,减少了一个处理过程,数据的传输时延也随之下降。

这个优点,对于AI计算和超级计算场景尤为重要。

易维护

这是相对于CPO方案来说的。

CPO方案中,如果系统中任何一个器件坏了,就要下电,把整个板子换掉,维护起来很不方便。

LPO的封装没有显著改变,支持热插拔,简化了光纤布线和设备维护,使用上更加方便。

LPO的当前挑战

通信距离短

去掉DSP,当然还是有代价的。TIA和Driver芯片并不能完全替代DSP,所以,会导致系统的误码率提升。误码率高了,传输距离自然就短了。

行业普遍认为,LPO只适用于特定的短距离应用场景。例如,数据中心机柜内服务器到交换机的连接,以及数据中心机柜间的连接等。

发展初级的LPO,连接距离从几米到几十米。未来,可能会拓展到500米以内。

标准化刚起步

目前,LPO的标准化还处于早期阶段,在互联互通上可能会存在一些挑战。

对于企业来说,如果采用LPO,那么,需要具备一定的技术能力,能够制定技术规格和方案,能够探索设备和模块的边界条件,能够进行大量的集成、互联互通测试。

换言之,LPO目前更适合较为封闭和供应商单一的系统。如果采用多供应商,自己又没有实力驾驭,那么,可能存在“问题较难界定,相互扯皮”的问题,还不如使用传统DSP方案。

此外,也有专家指出,LPO给系统侧的电通道设计带来了一定挑战。目前SerDes主流规格是112G,很快将升级到224G。专家们认为,LPO没办法跟上224G SerDes的要求。

LPO的产业化进展

LPO方案其实之前就有企业提出过,但是因为技术限制,没有做出什么成果。

今年的OFC大会上,LPO再次被提出,很快成为行业关注的焦点。

AWS、Meta、微软、谷歌等国际市场主要客户,都对LPO表示了兴趣。众多光通信巨头,也纷纷投入资源进行研发。

LPO方案的关键,还是在于芯片。高线性度TIA&Driver的主要供应商,有Macom、Semtech、美信等。

根据预测,2024年,LPO将实现规模商业化。行业里比较乐观的机构认为,未来LPO能占据一半的市场份额。保守一些的机构则认为,CPO/LPO的份额将在2026年达到30%左右。

结语

好啦,以上就是关于LPO的介绍。

LPO的逻辑本质,就是平衡和取舍。它基于特定的应用场景(短距离),舍弃了DSP/CDR,牺牲了一点性能(误码率),但是,换来了更低的功耗、成本和时延。

它和CPO各有所长,虽然诞生的时间比CPO更晚,但落地的速度,会比CPO更快。

方案优缺点的对比

按目前的趋势,LPO将是800G时代最具潜力的技术路线。

随着AIGC浪潮的发展,数据中心光网络将加速向800G演进。LPO的黄金时代,即将到来。

参考文献:

1.《硅光在新一代 PON、800G互联和相干下沉应用及产业化》,潘栋;

2.《AI时代的光通信机遇和挑战》,李俊杰;

3.《LPO vs CPO 谁将主宰未来数据中心光互联》,薛振峰;

4.《800G光模块,AI算力底座》,兴业证券;

5.《AI算力时代,光模块新技术演进路径》,长城证券;

6.《LPO技术是800G时代最具潜力路线 有望在2024年底迎来量产》,国盛证券;

7.《揭秘智算中心网络建设新利器:LPO技术的出现》,锐捷网络;

8.《线性驱动光模块专家交流会纪要》。

本文来自微信公众号:鲜枣课堂 (ID:xzclasscom),作者:小枣君

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年9月26日 10:34
Next 2023年9月26日 11:18

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日