EP39. 突破 200Gbps 傳輸極限：NVIDIA 微環調變器技術探討

Apr 09, 2026

隨著 AI 運算工作負載的快速擴張，資料中心正從以 CPU 為中心的架構轉向 GPU 驅動的系統，這對互連頻寬密度與功耗提出了嚴苛的要求。在此背景下，共同封裝光學 (CPO) 架構被視為具備高度潛力的解決方案，相較於傳統可插拔光模組，CPO 能顯著提升能源效率並縮短高速電氣路徑。

NVIDIA 於 2025 年 GTC 大會上發布了基於 TSMC COUPE 平台的 1.6 Tbps CPO 交換器，展示了矽基微環調變器 (Micro-Ring Modulator, MRM) 在高密度光學互連中的實用性。在 OFC 2026 的最新文獻中，NVIDIA 進一步探討了將 MRM 推升至單波 200Gb/s (100 Gbaud PAM-4) 速率的技術路徑。本文將基於該文獻，從電學頻寬展延、光學動態特性，以及光電熱協同模擬三個維度，解析 200Gbps MRM 設計背後的物理機制與工程權衡。

1. Background: 矽光子調變器

1.1. Modulators for SiPH of CPO

在共同封裝光學 (CPO)架構中的矽光子 (Silicon Photonics, SiPh) ，光調變器 (Modulator) 扮演「電光轉換(EO)」的核心角色。它負責將晶片運算出的高速電子訊號，轉換為光纖中傳輸的光訊號。由於資料中心與 AI 運算對頻寬密度、功耗與散熱的要求日益嚴苛，產業界在調變器的選擇上出現了不同的技術路線。各家大廠依據其系統架構的需求與權衡 (Trade-off)，分別有 MZM、EAM 與 MRM 三種主要技術(請參考EP14. SiPH MRM介紹; EP27. Marvell + Celestial AI = ?)。

source: Lightmatter

source: Lightmatter

MZM (Broadcom 採用)：主打訊號穩定

優勢： 訊號品質最佳，且不易受溫度變化影響。
劣勢： 物理體積最大，難以滿足極致的封裝密度需求。
定位： 適用於傳統要求高可靠性與長距離傳輸的網路交換器。

EAM (Celestial AI採用)：主打平衡與低功耗

優勢： 體積適中，驅動電壓極低，有助降低動態功耗。
劣勢： 光損耗較高，且需特殊材料 (鍺) 增加製程複雜度。
定位： 適用於距離較短但需兼顧密度與功耗的晶片或機架間互連
Marvell 已於 2026 年初完成對Celestial AI的收購(高達 32.5 億美元)

MRM (NVIDIA 採用)：主打極致頻寬密度

優勢： 體積極小 (微米級)，極易實現分波多工 (WDM)，提供最高的頻寬密度。
劣勢： 對溫度極度敏感，易導致訊號遺失。
定位： 透過先進的 3D 封裝 (如 TSMC COUPE) 與微型加熱迴路克服熱控制難題，專攻 AI 運算所需的極高密度互連。

source: Lightmatter

1.2. Si based MRM

矽基微環調變器 (Silicon-based Micro-Ring Modulator, MRM) 是利用光學共振原理進行電光轉換的核心元件。

source: Intel

物理結構 (P-N Junction, Contact, Heater)

P-N 接面 (P-N Junction):

微環波導的核心區域由摻雜的矽構成，形成 P 型 (圖中淺橘色 P Si) 與 N 型 (圖中淺藍色 N Si) 半導體介面。這是執行高速光調變的主動區。為了與金屬電極建立低電阻的歐姆接觸，波導外圍會進行高濃度摻雜，形成 P+ Si 與 N+ Si 區域。

接觸電極 (Contact):

圖中以白色標示的區塊。這些是導電通孔 (Vias)，負責將高濃度的 P+ 與 N+ 矽結構往上連接至電子積體電路 (EIC) 的金屬佈線。高速驅動電訊號便是透過這些 Contact 注入 P-N 接面。

微型加熱器 (Heater):

位於波導上方的金屬環形結構 (箭頭所指處)。矽的折射率具有顯著的熱光效應 (Thermo-optic effect)，微環的共振波長會隨環境溫度漂移。加熱器透過輸入低頻直流電流產生焦耳熱，提供局部的溫度控制，將微環的共振波長精確「鎖定」在雷射的工作波長上。

運作核心物理機制 (Plasma Dispersion 原理)

純矽材料缺乏天然的線性電光效應 (普克爾效應 Pockels effect)，因此矽光子技術必須依賴電漿色散效應 (Plasma Dispersion Effect，或稱自由載子色散效應) 來改變光學特性。

載子濃度與折射率的關聯: 根據此物理原理，當矽材料內部的自由載子 (電子與電洞) 濃度發生改變時，會同步改變矽波導的「折射率」與「光吸收係數」。

空乏型調變 (Depletion Mode): 在 MRM 中，最常採用逆向偏壓 (Reverse Bias) 來操作 P-N 接面。施加電壓會改變 P-N 接面中間「空乏區 (Depletion Region)」的寬度，進而將載子推開或拉回。這種載子濃度的瞬間抽離或注入，會引發波導有效折射率的改變，這是達成超高速 (如 100Gbps 或 200Gbps) 訊號調變的物理基礎。

source: Lightmatter

source: Intel

在矽光子微環調變器 (MRM) 的實務設計中，將雷射載波 (λ_in) 設定在共振頻譜的左側 (較短波長、高頻率端，稱為 Blue-detuned)，而非右側，主要是基於熱穩定性的物理考量。

決定性原因：熱穩定性 (Thermal Stability) 與負回饋機制

矽材料具有極強的熱光效應 (Thermo-optic effect)，即溫度上升會導致折射率增加。當強功率的雷射光耦合進入微環內部時，光學損耗 (如雙光子吸收或載子吸收) 會產生熱能，使微環局部升溫。這個熱效應會使整個共振頻譜向右側 (長波長端，即紅移 Red-shift) 偏移：

若將 λ_in設在左側 (目前作法)：

當微環發熱導致頻譜向右偏移時，共振谷底會「遠離」固定的雷射波長 λ_in。這會導致耦合進入微環內部的光能量減少，發熱量隨之降低，微環逐漸冷卻並將頻譜拉回原位。
這是一個負回饋 (Negative Feedback) 系統，能自動維持光學工作點的動態穩定。

若將 λ_in設在右側 (不被採用)：

當微環發熱使頻譜向右偏移時，共振谷底反而會「靠近」雷射波長 λ_in。這會導致更多的光能量進入微環，產生更多熱量，促使頻譜進一步右移。
這是一個正回饋 (Positive Feedback) 系統，會引發「熱失控 (Thermal Runaway)」或雙穩態現象，導致調變器完全失去控制。

配合空乏型 (Depletion-mode) 調變機制

當施加更大的逆向偏壓 (由 V_B1)增加到 V_B2) 時，PN 接面的空乏區變寬，自由載子被抽離。
根據矽的光學色散物理，載子濃度下降會導致矽的折射率上升。折射率上升同樣會使共振頻譜向右側 (紅移) 偏移。
當 λ_in鎖定在左側斜坡時，頻譜從V_B1往右移動到 V_B2 的過程中，該波長對應的「插入損耗 (Insertion Loss)」會從下方星星，代表光強度弱，訊號 Level 0，到上方星星，代表光強度強，訊號 Level 1。這形成了一個正向的振幅調變邏輯。

1.3. 微環調製器的光學與電學互動

source: IEEE

物理機制的根本差異：共振 vs. 寬頻低通

電學端需要「寬頻低通」：MRM 的輸入端接收的是數位基頻訊號（如 200Gbps PAM4）。數位訊號的頻譜非常寬廣，從 0 Hz (DC) 一直平坦地延伸到50GHz (奈奎斯特頻率)。因此，電氣輸入端必須表現為一個平滑的低通濾波器，讓所有頻率成分都能無失真地通過。

光學端需要「共振」：MRM 的光學本質是一個諧振腔。它必須依靠光波在環內的多次建設性干涉（共振），才能放大微小的折射率變化。既然是共振系統，就必須使用 Optical Q 來量化其能量儲存能力與共振峰的銳利度。

MRM 的建模就是一個多變數的最佳化過程，旨在 200Gbps 的硬性速度要求下，找出電氣參數與光學物理結構的最佳妥協點。

1.4. 首款 200G/lambda 微環調變器

NVIDIA 在 2025 GTC 推出Quantum-X Photonic Switch 的 CPO，基於TSMC COUPE 製程以及業界首款 200G/lambda 微環調變器 (Micro-Ring Modulator, MRM) 設計:

source: Nvidia

極小化尺寸與超高頻寬密度

傳統矽光子多採用體積較大（毫米等級）的馬赫-曾德爾調變器 (MZM)，難以滿足 CPO 的高密度需求。MRM 的尺寸僅微米等級，大幅縮小物理尺寸，允許在單一光子積體電路 (PIC) 上高密度佈建光學通道，從而實現數十 Tbps 的總頻寬。

單波長 200G PAM4 訊號處理

此 MRM 設計具備極高的調變頻寬與線性度，能夠直接對接交換器 ASIC 上的 200G SerDes，穩定調變並傳輸單波長 200 Gbps 的 PAM4 高速訊號。

突破熱敏感限制 (波長鎖定)

MRM 先天對溫度變化極度敏感，溫漂易導致諧振波長偏移而遺失訊號。此方案的成功關鍵在於電子積體電路 (EIC) 中設計了精準的閉環控制迴路，透過微型加熱器 (Micro-heater) 進行即時且精確的熱補償與波長鎖定 (Wavelength Locking)

高度依賴 3D 封裝 (TSMC COUPE)

200Gbps MRM 的高效運作需仰賴極低的電氣損耗。TSMC COUPE 技術將驅動 MRM 的 EIC 透過 3D 混合鍵合(Hybrid Bonding)直接覆晶堆疊於 PIC 之上，將電氣傳輸路徑縮至最短，有效降低寄生電容與高頻訊號衰減。

source: TSMC

COUPE 技術透過 3D 封裝與混合鍵合（Hybrid Bonding, HB）技術，將電子集成電路（EIC）與光子集成電路（PIC）直接垂直整合。這種做法徹底縮短了電氣路徑，將 RLC 寄生參數降至最低。在 200 Gbps 速率下，寄生參數的微小波動都會導致眼圖閉合。因此，利用 HB 技術實現的高度受控電氣界面，是確保高速信號完整性的最後一哩路(請參考EP37. 矽光子解析: 從 TSMC PDK 到 Nvidia 黑科技)

2. 電學特性分析

2.1. MRM Small signal model

下兩張圖展示了矽光子（Silicon Photonics）微環調變器的電氣小信號集總元件模型（Lumped-element model）以及其對應的頻率響應分析。這是在進行高速光收發模組設計時，評估電光頻寬極限與阻抗匹配的關鍵模型。

ource: OFC26. M2A.7, Nvidia

完整電氣小信號模型

將 MRM 的實體結構（包含金屬層、PN 接面、基板）對應到等效電路圖上。模型可以分為三個主要區塊：

核心 PN 接面 (Intrinsic Junction)：

這是 MRM 產生電光效應（等離子色散效應）的核心。主要由接面電容 C_j 以及 P 型與 N 型摻雜區的串聯電阻（R_p 與 R_n，通常合併看作接面電阻 R_j）組成。C_j 與 R_j是決定元件本質頻寬的最關鍵參數。

寄生網路 (Parasitic Network)：

包含金屬佈線與 Pad 帶來的寄生效應，如金屬電阻 R_met(f)（可能隨頻率因集膚效應變化）、金屬間電容 C_met、高頻旁路電容 C_HB，以及與基板之間的寄生電容 C_sub 和基板電阻 R_sub。這些寄生元件會分流高頻訊號，導致頻寬劣化。

外部驅動與端接 (Driver & Termination)：

包含驅動端的訊號源阻抗 R_src、終端匹配電阻 R_term，以及等效電感 L_eq（通常來自打線 Wirebond、覆晶凸塊 Bump 或特定的電感佈線設計）。

ource: OFC26. M2A.7, Nvidia

系統轉移函數

上方圖的公式H_e(jω)定義了從輸入電壓到接面電壓的單端傳遞函數。因為模型中同時包含了電容（C_j 等）與電感（L_eq），這是一個標準的二階（Second-order）低通濾波器響應系統。

分母中包含了 ω（一階）與 ω²（二階）的項，這決定了系統的阻尼係數與諧振頻率，也直接影響眼圖的品質（如上升時間與 Overshoot）。

簡易 RC 版本 (L_eq= 0)

當系統不考慮電感效應（L_eq= 0）時，傳遞函數退化為一階 RC 低通濾波器。這是評估 MRM 頻寬最基礎的基準點。

3dB 頻寬公式： f_3dB = 1 / [2 * π * C_j * (R_j + ( R_src || R_term))]
物理意義： 系統頻寬完全受限於核心電容 C_j 以及與之串聯的總電阻。這個總電阻包含了元件本身的 R_j，以及外部網路的等效電阻（驅動源電阻 R_src 與終端電阻 R_term 的並聯值）。
若要提升純 RC 系統的頻寬，只能從降低串聯電阻或降低接面電容

Trade-offs: 電信號和光信號

降低 R_j（通常需要提高摻雜濃度）：

提高摻雜濃度會引入大量自由載子，加劇自由載子吸收效應（Free Carrier Absorption, FCA），
導致光學損耗（α）增加、微環的品質因子（Q factor）下降，進而使直流消光比（DC ER）變差。

降低 C_j（通常需要減少接面面積或降低摻雜濃度）：

會導致相位調變效率（Phase Efficiency, PE）下降，同樣會惡化直流消光比（DC ER）

ource: OFC26. M2A.7, Nvidia

這張圖表展示了矽光子調變器設計中「調變效率」與「電氣頻寬」的物理互斥關係（Trade-off）：

VpiL（相位調變效率，Y軸）：

數值越小越好。代表能以更低的驅動電壓或更小的元件尺寸達成所需的光相位改變。
- VpiL 是衡量光調變器效率的指標，為「達成 180 度相位改變所需的電壓 (Vpi)」與「調變區長度 (L)」的乘積

Cpn（接面電容，X軸）：

數值越小越好。代表 RC 延遲越低，元件的高頻頻寬越大。
降低電容意味著削弱了電場對載子的控制力，因此需要耗費更多的電壓來彌補光學效能的不足

2.2. Inductive Peaking

在台積電 (TSMC) 的 COUPE (Compact Universal Photonic Engine) 共封裝光學架構下，電感峰化 (Inductive Peaking) 技術被視為突破電氣頻寬瓶頸、實現 200Gbps 傳輸速率的最佳解決方案。

COUPE SoIC-X 架構：降低寄生與精準控制電感

傳統的光電封裝（如打線 Wirebond 或微凸塊 Micro-bump）會引入極大且難以控制的寄生電感與電容，導致高頻訊號嚴重衰減並產生不可預測的反射。

TSMC 的 SoIC-X 屬於無凸塊 (Bumpless) 的前段 3D 晶片堆疊技術，能將光子晶片 (PIC) 與電子晶片 (EIC) 直接以銅對銅 (Cu-Cu) 鍵合，互連距離縮短至微米等級。這項技術大幅消除了不可控的封裝寄生效應。在寄生干擾被最小化的前提下，晶片設計者才能在佈局中，刻意加入並「精準控制」特定數值的峰化電感 (Peaking Inductor)。這個自訂的電感能夠真正發揮展延頻寬的作用，而不會與隨機的封裝寄生效應疊加而導致訊號失真。

source: OFC26. M2A.7, Nvidia

從單極點 (1-pole) 到雙極點 (2-pole):200Gbps 的頻寬展延

在純電阻與電容 (RC) 的系統中，訊號的傳遞函數屬於單極點 (One-pole) 低通濾波器。其高頻響應會隨著頻率增加而呈現平滑衰減，頻寬完全受限於 RC 時間常數，難以滿足 200Gbps（例如 100 Gbaud PAM4）所需的極高頻寬要求。

透過引入上述精準控制的電感 (L)，系統會從一階 RC 網路轉換為包含 R、L、C 的雙極點 (Two-pole) 網路。在特定的高頻區段，該電感會與系統的寄生電容產生輕微的諧振 (Resonance)。這個諧振效應能提供額外的增益，剛好補償 RC 網路造成的高頻衰減。這種設計能將 -3dB 頻寬顯著向高頻推移 (Bandwidth Extension)，在不改變電晶體或光學接面本質特性的情況下，突破物理限制。

source: OFC26. M2A.7, Nvidia

依賴先進 EDA 工具進行精準電磁模擬

在接近或超過 100GHz 的操作頻率下，晶片上的金屬佈線已不能視為理想導線，集膚效應 (Skin Effect)、鄰近效應與基板損耗變得極為顯著。

為了獲得準確的峰化電感值，傳統基於規則的 RC 萃取工具 (RC Extraction) 已不敷使用。工程師必須仰賴全波 (Full-wave) 或準靜態 (Quasi-static) 的電磁 (EM) 模擬工具，例如 Ansys RaptorX、Cadence EMX 或 Lorentz PeakView。這些工具能對自訂形狀的螺旋電感 (Spiral Inductor) 或傳輸線 (T-coil) 進行 3D 電磁場解析，確保萃取出的等效電感值 (L) 與品質因子 (Q) 完全符合雙極點電路模型所需的參數，藉此避免電感量過大造成的過度峰化 (Overshoot/Ringing)，或電感量不足導致的頻寬展延失效

2.3. TSMC COUPE 的封裝優勢

TSMC COUPE (COmpact Universal Photonic Engine) 平台結合 SoIC-X (System-on-Integrated-Chips) 3D 堆疊技術，在光電共封裝架構下帶來的突破性電路設計優勢。SoIC-X 是一種無凸塊 (Bumpless) 的晶圓級 3D 堆疊技術，能將電子晶片 (EIC) 與矽光子晶片 (PIC) 進行超細間距的銅對銅直接鍵合。

source: OFC25, TSMC

超短互連距離：消除高頻反射與損耗

物理挑戰： 在高頻 (如 100GHz) 傳輸時，為避免嚴重的訊號反射，傳輸線長度必須小於波長的八分之一 (l < 波長/8)，這意味著互連長度必須小於 250微米。傳統的打線或微凸塊封裝極難達成此要求，導致高頻訊號嚴重衰減。
SoIC-X 優勢： 透過將 EIC (如 TIA 或 Driver) 直接 3D 覆晶堆疊於 PIC (PD 或 Modulator) 正上方，互連路徑幾乎僅剩下垂直過孔的距離 (遠小於 250微米)
工程效益： 從圖中的 S21 頻率響應圖可以看出，這種極短互連能確保訊號在高頻範圍內維持極低的損耗。這大幅簡化了高頻阻抗匹配的難度，並確保 200Gbps 訊號的完整性

source: OFC25, TSMC

3D 堆疊電感：極大化電感密度與節省面積

物理挑戰： 在高速驅動電路中，常需要使用電感進行峰化 (Peaking) 來擴展頻寬，但傳統平面螺旋電感會佔用極大的晶片面積。
SoIC-X 優勢： 系統現在同時擁有了 EIC 與 PIC 兩顆晶片的頂層金屬線 (Top-level metals)。設計者可以將 EIC 的電感與 PIC 的電感在垂直方向上對齊堆疊
工程效益： 由於兩個電感極度靠近，產生了強烈的互感效應 (Mutual Inductance)。從圖表的綠線可知，總電感量將大於兩個獨立電感相加的兩倍 (>2X)。這代表可以在極小的 XY 平面面積內，實現極大的等效電感值，大幅提升晶片的面積使用效率

source: OFC25, TSMC

垂直電感結構：實現零平面面積的被動元件

物理挑戰： 即便是堆疊電感，仍需要佔用一定的水平面積
SoIC-X 優勢： 這是一個非常創新的設計概念。工程師直接利用 SoIC-X 介面的銅對銅鍵合柱 (Bonding pads/vias) 作為電感的垂直導電腳 (Inductor legs)，結合 EIC 與 PIC 的金屬走線，形成一個跨越兩顆晶片的「垂直線圈」
工程效益： 如圖所示，這種 1-turn 或 2-turn 的垂直電感，其磁場方向平行於晶片表面。最重要的是，它幾乎不佔用任何水平 (Horizontal) 晶片面積。這為空間極度受限的高密度光收發引擎提供了極具價值的設計彈性。

TSMC COUPE SoIC-X 技術不僅僅是將兩顆晶片封裝在一起，它更打破了傳統 2D 電路佈局的限制。它賦予了 IC 設計工程師利用「垂直 Z 軸」維度來縮短關鍵射頻路徑、創造高密度 3D 被動元件的能力，這是實現次世代 200Gbps 甚至更高傳輸速率光學引擎的關鍵硬體基礎。

3. 光學特性分析

3.1. 光學動態特性(Optical Dyanmics)

探討完電氣小信號模型後，本節介紹微環調變器 (MRM) 另一個更棘手的物理限制：光學動態特性 (Optical Dynamics)。在評估 AI 叢集的高速互連架構時，純電氣頻寬已不足以描述全貌。MRM 本質上是一個光學諧振腔，光子在環內的充放電時間 (Photon Lifetime) 構成了獨立於電氣 RC 延遲之外的「光學頻寬」限制。

以下針對 Lorentzian 轉移函數和時域耦合模理論（Coupled Mode Theory, CMT）(請參考 6. 補充說明)下的光學動態、Q 值、失諧量(detuning)，以及為何 200Gb/s 必須仰賴動態補償進行解析：

source: OFC26. M2A.7, Nvidia

核心動態方程式與光子生命週期

圖中 da/dt 的微分方程式描述了環內光場振幅 a(t) 的動態變化

方程式中的 1/τ 代表總衰減率，由 1/τ_e (與直通波導的耦合損耗) 以及 1/τ_l (環內部的本質損耗) 組合而成
極點 (poles) 公式p_1,2 = -1/τ +/- j*∆ ω 清晰顯示了系統的響應極限。實部 - 1/τ 決定了光子在環內存活的時間 (Photon Lifetime)。
光子存活時間越長，光學系統對於高速訊號的反應就越遲鈍，這等同於一個光學低通濾波器

Q 值 (Q-factor) 的雙面刃

品質因子 Q 值與總衰減率 (1/τ) 成反比

高 Q 值的優勢 (效率)： 光子在環內繞行圈數多，能大幅提升電光調變效率，讓驅動電路能以極低的電壓推動光信號
高 Q 值的代價 (頻寬)： 高 Q 值意味著極窄的 Lorentzian 共振頻譜與極長的光子存活時間。在 100 Gbaud (即 200Gb/s PAM-4) 的極高符號率下，單一符號寬度僅約 10 皮秒 (ps)。如果環的高 Q 值導致光子的存活時間接近或大於 10ps，光腔就會來不及反應電壓的快速切換，造成舊符號的光子殘留並干擾新符號，這稱為光學符號間干擾 (Optical ISI)。

失諧量(Detuning, ∆ ω) 的動態影響

失諧量 ∆ ω 是雷射載波頻率 (ω_c) 與微環共振頻率 (ω_r) 的差值

靜態偏置： 系統會透過微型加熱器 (Heater) 控制環的溫度，將 ω_r 推移到一個固定的 ∆ ω，作為直流工作點。
動態拍頻 (Beating)： 在高速調變時，驅動電壓改變了矽的折射率。當 ω_r 以 ω_m 的頻率被左右拉扯時，會導致正在通過該元件的連續光載波 (ω_c) 受到週期性的振幅與相位衰減。圖右下角的頻譜顯示，這個過程會產生上邊帶 (USB) 與下邊帶 (LSB)
非線性失真： 最終光偵測器接收到的電流 (Iω_m) 是載波與邊帶的拍頻 (Beating) 結果。由於 Lorentzian 頻譜的斜率是不對稱且非線性的，當高速訊號的邊帶超出微環的光學線性區時，訊號會遭遇嚴重的振幅衰減與群延遲 (Group Delay) 變異。

200Gb/s PAM-4 系統為何必須進入動態補償？

Tx DSP 預先等化 (Pre-emphasis / FFE)： 數位訊號處理器必須建立 MRM 的非線性 Lorentzian 模型，在發射端預先增強高頻成分，並非線性地調整不同 PAM-4 眼階的驅動電壓，以「逆向抵銷」光學低通與非線性效應。
光學動態峰化 (Optical Peaking)： 利用大訊號驅動時特定的藍移/紅移非線性動態，刻意在某個瞬間製造較大的 ∆ ω 變化量，擠壓光子快速離開共振腔，藉由產生光學的 Overshoot 來拓寬系統的整體等效頻寬

3.2. 光子存活時間

source: OFC26. M2A.7, Nvidia

核心物理量 (光子存活時間)：

決定 MRM 光學頻寬的關鍵在於光子在環內的存活時間。時間越長，頻寬越窄（越容易發生高速干擾）。
τ_e (外部耦合時間)： 由微環與直通波導之間的實體間距 (Gap) 決定。間距越小，耦合越強，τ_e 越小。
τ_l(內部損耗時間)： 由微環內部的波導散射與載子吸收損耗決定。

欠耦合 (Undercoupled, τ_e>τ_l) ── 靜態優、動態劣：

特徵：光子存活時間長，具備極高的 Q 值與極佳的「靜態」消光比。
致命傷：在 200Gb/s 的極速切換下，光子來不及進出微環，導致嚴重的光學符號間干擾 (Optical ISI)，因此不適用於極高速傳輸。

過耦合 (Overcoupled, τ_e<τ_l) ── 靜態妥協、動態致勝：

特徵：光波導與微環耦合極強，光子存活時間大幅縮短（Q 值較低）。
優勢：雖然犧牲了部分靜態消光比，但成功拓寬了「光學頻寬」，使光腔的反應速度能跟上 200Gb/s 的訊號切換，這是目前高速系統的主流硬體設計

動態工作點 (Detuning)：

系統會將工作點設定在共振頻譜的「斜坡」上，而非谷底，以此在調變幅度 (OMA) 與消光(ER)比之間取得最佳平衡，並依賴後端的 DSP 進行非線性預先補償
微環調變器 (MRM) 的電光頻率響應 (EO S21) 隨著靜態失諧量 (Detuning) 增加而產生的動態變化。

source: OFC26. M2A.7, Nvidia

頻寬 (BW) 變大： 增加偏移量能引發「光學峰化 (Optical Peaking)」效應，提供額外的高頻增益來補償衰減，進而大幅展延系統頻寬。

品質因子 (Q) 與消光比 (ER) 變小： 工作點遠離共振谷底，微環的高 Q 值束縛效應減弱；同時，調變造成的「光功率變化比例」縮小，導致消光比 (ER) 下降

動態非線性增加： 遠離谷底會進入共振曲線的非線性區，容易造成 PAM-4 訊號在高速切換時的眼階失真。要靠Tx DSP 預先等化 (Pre-emphasis / FFE)處理。

OMA 優於 ER 的系統考量： 在 200Gb/s 的極速環境下，接收端判讀訊號的關鍵在於「絕對的光功率差 (OMA)」能否克服熱雜訊。若為追求高 ER（高比例）而將工作點設在谷底，會導致整體光功率過低而無法被偵測。因此，實務上會選擇較大的偏移量以保證頻寬與 OMA，並犧牲部分 ER。

3.3. Summary: Q 值、Detuning、OMA、BW

諧振腔記憶效應與 ISI 的物理根源

高 Q 值意味著光子在微環內的存活時間 (Photon Lifetime, τ) 極長。當傳輸200Gbps PAM-4 訊號時（符號週期為 10 皮秒），若光子存活時間大於符號週期，前一個位元的光子就會殘留在腔體內，與下一個位元的光子產生干涉。這就是所謂的「諧振腔記憶效應 (Cavity Memory Effect)」，也是造成光學符號間干擾 (Optical ISI) 的元凶。因此，系統必須在靈敏度與頻寬之間尋求妥協。

DC OMA 最大化準則 (靜態靈敏度極值)

公式 Δλ ≈ λ0 / (2√3 * Q) 的物理意義，其實是 Lorentzian 共振曲線的反曲點 (Inflection Point)，也就是斜率最陡峭的位置。

在這個特定偏移量下，微環對於折射率改變的敏感度最高。
施加微小的驅動電壓，就能獲得最大的光穿透率落差，因此能夠將靜態的 DC OMA 推到絕對極大值。這通常是傳統低速 (如 50G) 系統的首選工作點。

增益頻寬積 (Gain-BW Product) 優化 (動態最佳點)

公式 Δλ ≈ (0.565 * λ0) / Q 揭示了高速系統必須做出的戰略退讓。

請注意數值差異：最大 OMA 點的係數 1 / (2√3) 約為 0.288，而最佳動態點的係數是 0.565 (幾乎是 0.288的兩倍)。
這意味著，為了達到最佳的動態響應，必須將工作點進一步向外推移（Detuning Δλ 變大），離開斜率最陡峭的地方。
雖然這會犧牲一部分的 OMA ，但如前次討論所述，更大的偏移量能引發強烈的「光學峰化效應」，大幅縮短等效的光子存活時間。這個頻率點，正是光學增益與頻寬展延交乘後的系統最佳甜區 (Sweet Spot)，能讓 200Gbps 訊號完整通過而不失真
在鎖定雷射波長時，不要停在最亮的地方 (最大 OMA)，請繼續往外推兩倍的距離，那是訊號跑得最快、眼圖最漂亮的地方

4. 系統級挑戰

針對 200Gbps 微環調變器 (Micro-Ring Modulator, MRM) 的設計，在微觀尺度下，電學、光學與熱學已形成緊密耦合的「權衡三角」。傳統單一物理域的孤立優化方式已經無法應付此世代的挑戰，必須仰賴 EDA 工具進行動態協同模擬 (Co-simulation) 才能確保穩定輸出與量產可行性。

三大物理域的交互影響

在 200Gb/s 的高頻寬需求下，MRM 內部的物理機制呈現零和博弈的特性，任一參數的調整皆會引發連鎖反應：

電學與光學的拉扯 (效率與速度互斥)： 電學設計追求極致頻寬 (BW) 與極低寄生電容 (Cj)。然而，若為了降低 RC 延遲而改變波導的摻雜濃度以降低電阻，會引入自由載子吸收效應，直接導致光學損耗增加（低電阻帶來高損耗）。

光學與熱學的拉扯 (高 Q 值加劇熱漂移)： 光學設計追求高調變深度 (ER) 與最佳失諧量 (Δλ)。若為了提升調變效率而提高微環的品質因子 (Q 值)，會使得共振波長對溫度變化變得極度敏感。微小的溫度波動即可導致波長漂移，使訊號嚴重失真。

熱學與電光的綜合影響 (自發熱與損耗)： 高頻操作與高光功率下，必須處理自發熱、雙光子吸收 (TPA) 與插入損耗 (IL) 問題。熱學效應會直接改變矽波導的折射率，進一步破壞光學共振條件與電學驅動的穩定性。

EDA 電-光-熱協同模擬架構

為了突破上述物理邊界，必須將非線性效應整合於統一的「動態緊湊模型 (Dynamic Compact Models)」中，透過 SPICE 或 Verilog-A 協同運算核心進行全域分析：

電學輸入建模： 納入寄生網路萃取、RF De-embedding 技術，以及驅動器阻抗匹配的高頻響應。

光學輸入建模： 處理功率波雙向模型，並計算四波混頻 (FWM) 與交叉相位調變 (XPM) 等非線性交互作用

熱學輸入建模： 建立 Foster-ladder 散熱網路模型，並精確模擬 TPA 與載子色散 (FCD) 所引發的動態熱分佈。

在 200Gbps 時代，只有透過此種將電、光、熱三者耦合的協同模擬引擎，才能在設計階段準確預測並補償非線性失真，獲得穩定的眼圖輸出。

5. 結論

要在單一微環調變器上實現穩定且低損耗的 200Gbps 傳輸，已無法單獨依賴單一物理域的優化。電學上對極致頻寬與低寄生電容的追求，會與光學效率及熱穩定性產生直接衝突。同時，高光功率下的自發熱、雙光子吸收 (TPA) 及載子色散效應，更為系統設計增加了多重非線性變數。

NVIDIA 的技術文獻與台積電 COUPE 封裝技術的結合，展示了克服這些物理邊界的可能路徑。未來的 AI 互連晶片設計，必須仰賴將電學、光學與熱學非線性效應整合的動態緊湊模型 (Dynamic Compact Models)，透過 EDA 工具進行全域的電-光-熱協同模擬 (Co-simulation) 。唯有透過跨領域的精確權衡與系統級協同設計，矽光子微環調變器才能真正滿足次世代資料中心對兆位元級 (Terabit-scale) 頻寬的嚴苛需求。

6. 補充說明: Journey of MRM

這是一段跨越世紀的技術演進史。矽光子微環調變器（MRM）的發展軌跡，完美詮釋了基礎物理理論如何經過工程學界的迭代，最終在特定的系統架構（CPO）中找到無可取代的定位。

理論萌芽：Lorentz 的阻尼共振模型 (1890年代)

MRM 的物理根基，建立在 19 世紀末 Hendrik Lorentz 對於古典電子振盪的探討。Lorentz 提出，任何具備能量儲存與耗散特性的受驅動阻尼系統，其穩態頻率響應都會呈現特定的對稱曲線。這個被後世稱為「洛倫茲轉移函數（Lorentzian Transfer Function）」的純物理數學模型，雖然最初用於解釋光譜線展寬，卻為百年後的光學共振腔設計定義了靜態光學特徵，包含共振波長、品質因子（Q factor）與直流消光比（DC ER）的基礎極限。

動態建構：時域耦合模理論(CMT)的導入 (2000年至2010年代)

隨著矽光子技術的興起，學者們（如 MIT 的 H. A. Haus 與 Caltech 的 A. Yariv）將巨觀的共振理論引入微米級的矽波導結構中。隨後，為了解決高速通訊的需求，W. D. Sacher 等學者將「時域耦合模理論（Coupled Mode Theory, CMT）」應用於 MRM。 CMT 補足了洛倫茲穩態模型的不足，透過精確計算光子在直通波導與微環之間的動態能量交換，成功解析了光子存活時間（Photon Lifetime）、極點與零點分佈。這使得工程師能夠以微分方程式預測 MRM 在大訊號切換下的光學符號間干擾（Optical ISI）與光學峰化（Optical Peaking）效應，為高速調變奠定了數學基礎。

模組時代的沉寂：不敵 MZM 與 EAM 的先天劣勢

儘管理論完備且具備極小的物理體積，MRM 在傳統可插拔光模組（Pluggable Transceivers）時代並非主流首選。其發展受制於兩大物理痛點：

極端的溫度敏感性： 矽具備強烈的熱光效應，微小的環境溫度波動就會導致微環的共振頻譜發生熱漂移，造成嚴重訊號遺失。
控制迴路的延遲： 傳統模組架構中，電子驅動 IC（Driver/Controller）與光子晶片（PIC）通常分開封裝。要實時監控微環溫度並透過微型加熱器（Micro-heater）進行精確的波長鎖定（Wavelength Locking），其電氣路徑過長，難以實現穩定且低延遲的閉環控制。

因此，在要求長距離傳輸與高環境耐受度的傳統網路交換器中，業界更傾向採用訊號最穩定但體積巨大的馬赫-曾德爾調變器（MZM），或是尋求體積與功耗相對平衡的電吸收調變器（EAM）。MRM 在此階段多被視為難以駕馭的實驗室元件。

AI 世代的重生：在 CPO 架構中大顯身手

AI 運算叢集的爆發，徹底改變了硬體架構的遊戲規則。當系統需求轉向極致的頻寬密度與極短的互連距離時，MZM 的毫米級體積成為無法克服的物理瓶頸。此時，MRM 憑藉微米級尺寸與天然支援分波多工（WDM）的優勢，迎來了歷史性的轉折。

真正的關鍵推手是先進 3D 封裝技術的成熟，如台積電的 COUPE（SoIC-X）平台。CPO 架構為 MRM 解決了過去的致命傷，並釋放了其潛力：

克服熱控制瓶頸： 透過 3D 混合鍵合，EIC 直接覆晶堆疊於 PIC 之上，極短的互連距離讓微型加熱器的閉環控制得以即時且精準地運作，穩定了 MRM 的熱漂移問題。
突破 200Gbps 電氣極限： 無凸塊（Bumpless）的直接鍵合消除了傳統封裝的龐大寄生參數。工程師進一步利用 EIC 與 PIC 的頂層金屬，設計出極高密度的 3D 垂直堆疊電感，精準實現雙極點電感峰化（Inductive Peaking），一舉將單波長傳輸速率推升至 200Gb/s 的物理極限

MRM 的旅程，是從基礎物理定律（Lorentz）出發，經過嚴謹的應用數學（CMT）建模，在傳統模組架構中歷經挫折，最終藉由半導體 3D 封裝技術（CPO/COUPE）的突破，完成光、電、熱三方協同優化。這不僅是單一元件的勝利，更是系統工程思維克服物理邊界的經典案例。

[Reference]

OFC26 M2A.7: Si Microring Resonator Modulators at >200Gb/s, David Patel Nvidia
矽光子微環調製器的 200Gb/s 時代：NVIDIA 的設計美學與權衡之道
EP14. SiPH MRM介紹
EP27. Marvell + Celestial AI = ?
EP36. 解析 NVIDIA 次世代光學引擎
EP37. 矽光子解析: 從 TSMC PDK 到 Nvidia 黑科技
EP0. 我的 AI 硬體探索地圖

Ted Yu

Discussion about this post

Ready for more?

Ted Yu

EP39. 突破 200Gbps 傳輸極限：NVIDIA 微環調變器技術探討

1. Background: 矽光子調變器

1.1. Modulators for SiPH of CPO

source: Lightmatter

source: Lightmatter

MZM (Broadcom 採用)：主打訊號穩定

EAM (Celestial AI採用)：主打平衡與低功耗

MRM (NVIDIA 採用)：主打極致頻寬密度

source: Lightmatter

1.2. Si based MRM

source: Intel

物理結構 (P-N Junction, Contact, Heater)

P-N 接面 (P-N Junction):

接觸電極 (Contact):

微型加熱器 (Heater):

運作核心物理機制 (Plasma Dispersion 原理)

source: Lightmatter

source: Intel

決定性原因：熱穩定性 (Thermal Stability) 與負回饋機制

若將 λin設在左側 (目前作法)：

若將 λin設在右側 (不被採用)：

配合空乏型 (Depletion-mode) 調變機制

1.3. 微環調製器的光學與電學互動

source: IEEE

物理機制的根本差異：共振 vs. 寬頻低通

1.4. 首款 200G/lambda 微環調變器

source: Nvidia

極小化尺寸與超高頻寬密度

單波長 200G PAM4 訊號處理

突破熱敏感限制 (波長鎖定)

高度依賴 3D 封裝 (TSMC COUPE)

source: TSMC

2. 電學特性分析

2.1. MRM Small signal model

ource: OFC26. M2A.7, Nvidia

完整電氣小信號模型

核心 PN 接面 (Intrinsic Junction)：

寄生網路 (Parasitic Network)：

外部驅動與端接 (Driver & Termination)：

ource: OFC26. M2A.7, Nvidia

系統轉移函數

簡易 RC 版本 (Leq= 0)

Trade-offs: 電信號和光信號

降低 Rj（通常需要提高摻雜濃度）：

降低 Cj（通常需要減少接面面積或降低摻雜濃度）：

ource: OFC26. M2A.7, Nvidia

VpiL（相位調變效率，Y軸）：

Cpn（接面電容，X軸）：

2.2. Inductive Peaking

COUPE SoIC-X 架構：降低寄生與精準控制電感

source: OFC26. M2A.7, Nvidia

從單極點 (1-pole) 到雙極點 (2-pole):200Gbps 的頻寬展延

source: OFC26. M2A.7, Nvidia

依賴先進 EDA 工具進行精準電磁模擬

2.3. TSMC COUPE 的封裝優勢

source: OFC25, TSMC

超短互連距離：消除高頻反射與損耗

source: OFC25, TSMC

3D 堆疊電感：極大化電感密度與節省面積

source: OFC25, TSMC

垂直電感結構：實現零平面面積的被動元件

3. 光學特性分析

3.1. 光學動態特性(Optical Dyanmics)

source: OFC26. M2A.7, Nvidia

核心動態方程式與光子生命週期

圖中 da/dt 的微分方程式描述了環內光場振幅 a(t) 的動態變化

Q 值 (Q-factor) 的雙面刃

品質因子 Q 值與總衰減率 (1/τ) 成反比

失諧量(Detuning, ∆ ω) 的動態影響

失諧量 ∆ ω 是雷射載波頻率 (ωc) 與微環共振頻率 (ωr) 的差值

200Gb/s PAM-4 系統為何必須進入動態補償？

3.2. 光子存活時間

source: OFC26. M2A.7, Nvidia

核心物理量 (光子存活時間)：

欠耦合 (Undercoupled, τe>τl ) ── 靜態優、動態劣：

過耦合 (Overcoupled, τe<τl ) ── 靜態妥協、動態致勝：

動態工作點 (Detuning)：

source: OFC26. M2A.7, Nvidia

3.3. Summary: Q 值、Detuning、OMA、BW

若將 λ_in設在左側 (目前作法)：

若將 λ_in設在右側 (不被採用)：

簡易 RC 版本 (L_eq= 0)

降低 R_j（通常需要提高摻雜濃度）：

降低 C_j（通常需要減少接面面積或降低摻雜濃度）：

失諧量 ∆ ω 是雷射載波頻率 (ω_c) 與微環共振頻率 (ω_r) 的差值

欠耦合 (Undercoupled, τ_e>τ_l) ── 靜態優、動態劣：

過耦合 (Overcoupled, τ_e<τ_l) ── 靜態妥協、動態致勝：