发布时间: 2025-09-19 17:01:03来源:智车行家
Microsoft研究团队和 Microsoft Azure 推出未来新的光传输方案 MOSAIC,它打破了光与铜的取舍困境,可同时实现长距传输、低功耗和高可靠性。MOSAIC 向后兼容现有标准链路形态(如可插拔 QSFP/OSFP)和电气主机接口(如 PCIe 或 VSR/MR),无需更改服务器或交换机即可直接替代现有光铜链路,并且已使用以太网和 InfiniBand 协议栈验证了原型机,并确认其与 NVink、CXL 等新型协议的兼容性。
Mosaic 采用 WaS 架构,即利用大量并行通道,每条通道以相对较低的 2Gbps 数据速率运行。采用 Micro LED 作为发射器,为实现 800Gbps 及更高速率扩展,可按目标链路速率与单通道速率的比值配置 Micro LED 数量(例如 800Gbps 链路需 400 个 Micro LED,以 20*20的网格排列,单 LED 速率 2Gbps)。
01
互联速度快速提升,多因素制约光与铜
当今数据中心网络中的链路技术必须在传输距离、功耗和可靠性之间做出根本性权衡。铜缆链路能效高且可靠性强,但传输距离极为有限(<2m),若使用有源铜缆,传输距离预计提升至 5-7m,但随着带宽速率进一步提升,对铜缆传输距离的挑战将进一步加大。光链路可提供更长的传输距离,却以高功耗和较低可靠性为代价。随着网络速度的提升(1.6T/3.2T),这种权衡关系愈发显著,制约着未来的可扩展性。
现有的光纤与铜缆的取舍源于它们对 NaF(narrow-and-fast)模块的依赖,该模块仅使用少量高速串行通道(例如 800Gbps 链路中的 8*100Gbps 个通道)。图 1 和图 2 展示了当前链路技术面临的根本性扩展瓶颈:随着数据速率提升,铜缆传输距离缩短,而光模块功耗攀升。无论是铜缆还是光域,这种糟糕可扩展性的根源都在于持续依赖少数高速通道的 NaF 架构。
基于基础物理限制。与可采用细间距布线密集走线的电路板走线不同,当多通道紧密排列时,长达数米的铜缆会遭受电磁干扰(EMI)和串扰问题。因此,铜缆通道数量超过一定程度后继续增加并不现实,迫使高速串行传输必须在较少通道上实现带宽最大化。虽然光纤消除了电磁干扰,但激光器功耗无法随通道数量增加而良好扩展。单个通信用激光器通常消耗数十至数百毫瓦功率,若扩展至数百个激光器将导致功耗过高。此外,大规模封装多个激光器和光纤的复杂性会带来严重的可靠性与制造限制。最后,由于可靠性问题,增加激光器数量会按比例提高故障率。
02
新光传输技术方案 MOSAIC,打破光铜取舍困境
Microsoft 研究团队和 Microsoft Azure 推出未来新的光传输方案 MOSAIC,它打破了光与铜的取舍困境,可同时实现长距传输、低功耗和高可靠性。MOSAIC 向后兼容现有标准链路形态(如可插拔 QSFP/OSFP)和电气主机接口(如 PCIe 或 VSR/MR),无需更改服务器或交换机即可直接替代现有光铜链路,并且已使用以太网和 InfiniBand 协议栈验证了原型机,并确认其与 NVink、CXL等新型协议的兼容性。
随着主流互联带宽提升至 1.6 Tbps 及更高速率。展望未来,由于持续提升单通道带宽面临挑战,我们预计主流方案与 Mosaic 之间的绝对功耗差距将逐代扩大。领先制造商的初步数据显示 1.6T 每个收发器功耗为 23-25W,相比之下,Mosaic 可通过每代倍增通道数量实现更高传输速率,这将使单个收发器功耗降至 10.6 瓦。事实上,随着 Micro LED 技术进一步成熟,预期未来还能实现更低的功耗水平。
MOSAIC 无需任何硬件改动即可无缝替代现有光缆和铜缆。确保所有组件都能适配现有外形规格,并支持与当今网络链路相同的电气接口,从而完全兼容当前网络架构和硬件。铜缆和光缆均采用相同的标准可插拔连接器(如 QSFP、OSFP)和电气接口(如 PCIe、 VSR/MR),这种设计确保了铜缆与光缆可混合部署的灵活性。
在 Mosaic 中采用了现有的铜缆和光缆类似的方法和标准,从而能够用 Mosaic 链路替代现有的光纤和铜缆链路,且无需对交换机或网络接口卡(NIC)进行任何修改。这为扩展到下一代网络速度提供了实用解决方案,同时保持与当前网络架构的完全兼容。
通过采用 Micro LED 作为光源,Mosaic 技术方案将解决当前光连接方案的痛点,为实现光学 WaS 解决方案提供了实用途径。
1、 首先,与铜线不同,Micro LED 采用光传输方式,消除了电磁干扰,使通道能够密集排布而互不干扰。
2、 其次,Micro LED 的工作电压仅需数百毫伏 ,比传统激光器低数个数量级,使得扩展至数百个通道也不会造成过高功耗。
3、 第三,单片集成的 Micro LED 阵列在 1mm*1mm die 中可容纳超过 400 个通道,结合Mosaic 紧凑型多芯成像光纤,能以简洁的封装设计实现超高密度解决方案。最重要的是,与需要温控和主动波长稳定的激光器不同,Micro LED 本身就更坚固耐用,且得益于其阵列特性,可轻松添加冗余通道以进一步提升可靠性。
2.1. MOSAIC 设计方案与总体架构
Mosaic 采用 WaS 架构,即利用大量并行通道,每条通道以相对较低的 2Gbps 数据速率运行。采用 Micro LED 作为发射器,为实现 800Gbps 及更高速率扩展,可按目标链路速率与单通道速率的比值配置 Micro LED 数量(例如 800Gbps 链路需 400 个 Micro LED,以 20*20 的网格排列,单 LED 速率 2Gbps)。
为验证 Mosaic 的设计方案,微软团队构建了一个包含 100 个通道的端到端原型系统,每个通道支持 2Gbps 传输速率。微软团队与 Micro LED 和 CMOS 供应商合作,定制生产了 10*10 阵列 Micro LED 及 CMOS 传感器晶片,并将其通过引线键合工艺装配至印刷电路板(PCB),该 Micro LED 器件除需独立控制每个像素外,与显示用 Micro LED 结构完全相同。接收端阵列方面,联合 CMOS 供应商制造了所示阵列。为提升耦合效率,公司专门定制了可插拔模块设计。
2.2. MOSAIC 性能评估
从性能评估结果来看, 原型已经验证了其在数据中心场景下的可行性。测试表明, MOSAIC 在 30 米传输距离内依然能够保持稳定的数据传输能力,这一距离远高于传统铜缆方案(通常 2 米以下)。当下因引线键合工艺、分立式电子与光学元件会造成通道数量和性能瓶颈,后续通过规避当前原型的限制,微软预计量产级可插拔模块将通过更紧密的光电集成与改进的 Micro LED 将进行改善。如图 8 所述,仿真数据表明 MOSAIC 可插拔模块应能在 50 米距离以上。
由于采用的是 Micro-LED 光源,而非激光器,兼具 10 倍于铜缆的传输距离和最高 68%能耗降低,以及于现有光链路 100 倍的可靠性优势。同时,通过直接调制的 Micro-LED 搭配低功耗模拟后端,整体链路的功耗相比传统光互连降低最高为 68%。
在电子系统调制方面,在 Mosaic 中,微软利用低速信道特性大幅简化电子设计,实现超低功耗解决方案。
由于 MOSAIC 使用的是“多通道并行”的架构,带宽的提升几乎可以通过增加通道数的方式线性扩展。目前原型实现的是 800G,该架构能够继续扩展到 1.6T 和 3.2T; MOSAIC 链路的传输距离和可达速度由 Micro LED 与 CMOS 传感器的特性决定,其中噪声和色散是主要限制因素。提升传输速度与距离需要同步改进 Micro LED 和 CMOS 传感器的性能。
对于 Micro LED,制造商预期将在发光效率、方向性和光谱宽度方面实现优化;对于 CMOS 传感器,与 CMOS 芯片(如跨阻放大器)更紧密的集成将显著提升链路灵敏度。
同时,若采用 CPO 技术,MOSAIC 将获得更大收益:得益于芯片间互连的低数据速率特性,可直接驱动微 LED 调制,无需像现有技术那样进行高速转换。
2.3. MOSAIC 兼容光和铜的优势,有望打破既有互连的限制
MOSAIC 通过在保持铜缆级功耗与可靠性的前提下,将链路长度扩展至数十米,打破了既有互连的限制。
由此,一些原本难以实现的网络架构成为可能:例如无需部署架顶交换机(ToR),服务器可直接连接行内或列尾交换机,既降低时延与硬件成本,又避免 ToR 带来的单点故障。相较之下,传统光互连因功耗、成本与可靠性代价较高,常常抵消这些收益。与此同时, MOSAIC 使全无阻塞拓扑更易落地,有望简化拥塞控制协议。更长距离的链路还让多维环面、蜻蜓及超立方体等先进拓扑走向实用,摆脱短距铜缆与现有光方案高成本、复杂度的束缚。总体而言,MOSAIC 显著拓展了面向应用定制的网络设计空间。
Mosaic 有意利用消费级领域的技术(如 Micro LED 和成像光纤)来实现实用化的 WaS 光链路并发挥其性能优势。为重新思考网络、GPU、内存和集群设计开辟了一系列前景广阔的机遇,但要实现这些愿景仍需大量工作来协同优化链路与系统架构技术,包括在封装工艺、部署方案、系统集成和大规模可靠性等多个领域取得进展。
03
MOSAIC 所带来的零部件增量
根据微软研究团队关于 MOSAIC 产品资料,我们预计该方案若起量,Micro LED、多芯成像光纤、TIR 透镜、CMOS 传感器、Micro LED 光连接器将成为主要受益对象。
3.1. Micro LED
从“窄且快”转向“宽且慢”:MOSAIC 用上百条低速并行光通道替代少数高速通道,发送端采用直接调制的 Micro LED 阵列,接收端用 CMOS 传感器,省去激光器、ADC/DAC 与复杂 DSP/FEC 前端的大量功耗与成本。
以论文推荐的 2 Gbps/通道为基准,800G 单向需要的有效数据通道数与冗余如下(按发送端 Micro LED 数量;接收端为 CMOS 传感器阵列):
1、最低配置(仅满足净吞吐,不含任何冗余)
数据通道:800 Gbps ÷ 2 Gbps ≈ 400 个 Micro LED。
2、加入轻量 ECC 的实用配置
采用汉明码:把 400 个数据通道按块做校验,示例参数 b=40, p=6,对应冗余通道 n=60,总计 400+60=460 个 Micro LED 方向。
3、再加热备通道(提升整链可靠性)
MOSAIC 进一步利用额外通道提升链路可靠性。该系统维护少量通道作为热备资源,当检测到某通道故障时,会立即切换至这些热备通道。
我们预测,若假设热备通道为 5%,以 460(含 ECC)+ 5% 备份(≈20)估算,推荐工程量级约 ≈480 个 Micro LED/单向;若追求更高可靠性热备通道可提升至 10-20%,可做 ≈500-550 个/单向。
小结(单向、发送端):
最低:≈ 400 颗 Micro LED(无冗余)。
含 ECC:≈ 460 颗。
含 ECC+5% 热备:≈480 颗(根据目标 FIT 可上调到 500-550)。
以此为基础,若光模块速率升至 1.6T/3.2T,单通道/通道数量有望呈现 1-2 倍的增长。
3.2. 多芯成像光纤
多芯成像光纤已实现大规模生产并广泛应用于医疗领域(如内窥镜检查)和照明系统,但通常不用于通信领域。单根光纤可包含多达 10,000 个纤芯,这一特性至关重要,因为它能在单根光纤内实现多路 MOSAIC 通道复用,从而大幅简化封装部署流程并降低成本。
理论上可以实现每个光纤纤芯与 Micro LED 的一对一映射。但在实际设计中,考虑到纤芯资源的丰富性,单个 Micro LED 映射到多个纤芯更具优势,这种方法显著降低了对准精度要求,从而有效减少了整体系统复杂度和成本。
以下是假设的单条多芯成像光纤和 800G 光模块的关系:
1、通道规模:按 2 Gbps/通道,800 G 单向考虑冗余的情况下,至少需 460 条数据通道(3.1 Micro LED 环节提及)。
2、与成像光纤的映射关系:图 11 明确每条通道映射到多个纤芯(并非 1:1),以放宽对准;因此一根成像光纤即可承载几百通道的 800 G 阵列。
3、可计算的“容量比例”(由文中两个数值推得的上限/均值,不是设计定值):
成像光纤纤芯数:≤10,000 个/根。
800 G(含 ECC 冗余)通道数:460 条。
理论纤芯:通道的平均容量比 ≈ 10,000 /460 ≈ 22:1
备注:论文并未给出固定的每通道用几颗纤芯,仅说明一通道映射多个纤芯以放宽对准;22.1 是依据单纤最多 1 万纤芯与 800 G 需 460 通道两项假定数字计算出的容量上限平均值,用于量级判断。
3.3. TIR 透镜
与传统激光器相比,使用 Micro LED 的一个主要缺点是前者属于朗伯发射体。如图 12(左)所示,它们的光线呈半球形发散,而非像激光那样形成准直光斑。这导致在不牺牲耦合效率的前提下,光线更难耦合进光纤。此外,在多通道配置中,朗伯光束的形态可能导致通道间串扰,因为单个 Micro LED 发出的光可能耦合至阵列中的相邻通道。
为解决这一问题,可以通过标准微透镜阵列,提升耦合效率,但仍无法捕获大部分光线。因此,微软团队开发了一种基于全内反射(TIR)原理的新型定制透镜设计。TIR 透镜在功能上类似于手电筒中使用的透镜,采用双组件微光学设计(如图 12 右所示)。该设计能将光线约束在透镜内部,耦合效率比 MLA 高出 2 倍以上。这些透镜的重要特点是:尽管设计非传统,但仍兼容采用纳米压印光刻技术的晶圆级、高通量及低成本制造工艺。
以 800G 光模块为例,我们假设每数据通道用一个 TIR 透镜,各情况计算如下:
3.4. CMOS
与用于通信的红外激光器不同,Micro LED 工作在可见光波段(400nm-700nm)。这一特性具有显著优势,因为它允许使用低成本 CMOS 传感器作为接收器,类似于手机摄像头中采用的元件。
从量的角度看,我们预计一通道=一接收像素/单元(1:1):论文中原型同时定制了 10×10 microLED 阵列与 10×10 CMOS 传感器阵列对应 100 条通道,说明在 MOSAIC 的并行架构下,接收端像素/单元数与通道数一一对应。
以 800G MOSAIC 光模块为例,各情况计算如下:
04
总结
随着主流互联带宽提升至 1.6 Tbps 及更高速率。展望未来,由于持续提升单通道带宽面临挑战,预计主流方案与 Mosaic 之间的绝对功耗差距将逐代扩大。虽然 1.6 Tbps 光链路尚未商用,但领先制造商的初步数据显示每个收发器功耗为 23-25W,相比之下, Mosaic 可通过每代倍增通道数量实现更高传输速率,这将使单个收发器功耗降至 10.6 瓦。事实上,随着 Micro LED 技术进一步成熟,预期未来还能实现更低的功耗水平。
基于论文,我们得出 MOSAIC 的主要增量为 Micro LED、多芯成像光纤、TIR 透镜、CMOS等环节,
建议关注相关的产业链:
Micro LED+光模块:兆驰股份
Micro LED 芯片:三安光电、兆驰股份、华灿光电、乾照光电、聚灿光电
多芯成像光纤:长飞光纤、长飞光纤光缆
潜在 TIR 透镜供应商:水晶光电、蓝特光学,美迪凯、炬光科技等
CMOS 传感器:豪威集团、思特威、格科微
潜在 Micro LED 光连接器供应商:太辰光,致尚科技 (参考来源:天风证券研究所)