Interkoneksi Optik Berkecepatan Tinggi: Solusi Pusat Data
Apr 27, 2026| Kuartal terakhir kami menerima pelanggan yang mengirimkan kembali empat puluh modul 400G DR4 yang mengklaim penutup tautan acak pada sakelar Arista 7060X5 mereka. Bahkan sebelum kami membuka dokumen RMA, teknisi penguji kami menanyakan satu pertanyaan: apakah Anda memeriksanyaKonektor MPOsebelum instalasi? Mereka belum melakukannya. Kami mengirimkan modul melalui regresi penuh, diagram mata bersih, BER di bawah 1E-13 di keempat jalur,Nominal pembacaan DDM. Lalu kami meminta mereka mengirimkan foto-ujung kabel utama mereka di bawah mikroskop fiber. Setiap konektor memiliki kontaminasi partikulat. Empat puluh modul, tidak ada cacat. Masalahnya adalah debu.
Kami melihat beberapa versi ini setiap bulan. Penerapan interkoneksi optik berkecepatan tinggi pada skala apa pun menemui hambatan yang sama, dan angka-angka tersebut mendukung hal tersebut: antara 65% dan 70% dari seluruh kegagalan tautan 400G dan 800G disebabkan oleh kontaminasi konektor, bukan karena kesalahan transceiver. (Data lapangan IEEE 802.3 melalui AscentOptics) Kami mengemukakan hal ini terlebih dahulu karena ini mencerminkan cara kami berpikir tentang keseluruhan keputusan interkoneksi. Modul ini hampir tidak pernah menjadi tautan terlemah. Lapisan fisik di sekitarnya adalah.

Pola Lalu Lintas Anda Menentukan Arsitektur Interkoneksi Optik Anda
Setiap orang memulai dengan nomor bagian.QSFP-DD atau OSFP, SR atau DR, multimode atau-mode tunggal. Kami juga melakukannya. Namun penerapan yang berjalan baik bagi pelanggan kami semuanya dimulai dari tempat lain: seperti apa lalu lintas sebenarnya?
Pelatihan AI-berskala besar menghasilkan-semua-komunikasi GPU yang ternyata dapat diprediksi secara mengejutkan dalam rentang waktu menit hingga jam. Google mengeksploitasi hal ini dengan saklar sirkuit optik di jaringan Jupiter mereka, mengkonfigurasi ulang jalur cahaya fisik antar rak alih-alih berpindah paket. Hasil yang dipublikasikan dari penggunaan produksi selama satu dekade: pengurangan daya sebesar 41%, belanja modal 30% lebih rendah, dan peningkatan waktu operasional fabric sebesar 50x dibandingkan arsitektur Clos sebelumnya. (Google SIGCOMM'22) Angka-angka tersebut memang nyata, tetapi angka-angka tersebut berasal dari perusahaan yang menghabiskan antara $500 juta dan $1 miliar untuk infrastruktur OCS selama lima tahun. Kami memiliki beberapa pelanggan-ukuran menengah yang meminta kami mengevaluasi kelayakan OCS untuk lingkungan mereka. Dalam setiap kasus, setelah mereka menjalankan angka pada skala di bawah-500 node, kebutuhan modal melebihi manfaat konfigurasi ulang, dan mereka tetap menggunakan metode konvensional yang menggunakan modul yang dapat dipasang.
Inferensi membalikkan persamaan. Lalu lintas padat dan tidak dapat diprediksi pada tingkat aliran, dan toleransi latensi mendekati nol. Anda tidak dapat mengonfigurasi ulang jalur optik berdasarkan-permintaan. Yang Anda perlukan adalah fabric dengan penyediaan berlebih secara konsisten dengan latensi deterministik, yang mendorong Anda menuju transceiver yang dapat dicolokkan dalam topologi spine-leaf di mana setiap link selalu menyala. Kami menjual modul ke dalam kedua skenario, dan percakapan teknisnya sangat berbeda. Pembeli klaster pelatihan ingin mengetahui tentang bandwidth agregat per rak dan daya per bit. Pembeli inferensi bertanya tentang latensi ekor dan apa yang terjadi jika tautan tidak berfungsi.

Untuk lingkungan perusahaan dan colo tradisional di bawah hyperscale, biaya per port mendominasi dan kompatibilitas dengan pabrik fiber yang ada lebih penting daripada kepadatan bandwidth mentah. Kami telah menguji kamiModul QSFP-DD 400G di 14 platform switchtermasuk Cisco Nexus 93600CD, Arista 7060X5, dan Juniper QFX5220. Dalam lingkungan tersebut, perhatian utama bukanlah kecepatan. Tergantung apakah modul dikenali oleh firmware sakelar tanpa perintah penggantian manual.
Zona Mati 800G yang Membuat Para Insinyur Lengah
Pada 400G, memilih interkoneksi memerlukan proses dua-langkah: mengukur jarak, memilih tembaga atau serat. DAC pasif menempuh jarak 3 hingga 5 meter dengan nyaman. 800G memecahkannya. Setiap jalur menjalankan 112G PAM4. Kehilangan tembaga pada frekuensi tersebut kira-kira dua kali lipat dibandingkan 400G, dan hasilnya adalah batas maksimum sekitar 2 meter untuk kabel pasif.

Kami mempelajarinya dengan cara yang mahal. Pelanggan awal memesan kamiRakitan DAC pasif 800Gdalam panjang 3 meter berdasarkan tata letak rak 400G. Pelatihan tautan gagal di lebih dari 60% port. Tembaganya tidak rusak; fisika tidak mengizinkannya. Mereka beralih ke AEC untuk lari 3 hingga 5 meter dan modul optik yang dapat dicolokkan untuk aktivitas lainnya, dan penerapannya menjadi stabil dalam waktu seminggu. Sejak itu, kami berhenti menerima pesanan untuk 800G DAC pasif di atas 2,5 meter dan menambahkan peringatan jarak penerapan ke proses konfirmasi pesanan kami.
AEC sekarang memiliki jarak 3 hingga 7 meter. Retimer digital meregenerasi sinyal secara elektrik tanpa konversi optik, sehingga menghemat biaya namun menambah latensi. KP4 FEC sendiri menghasilkan 50 hingga 100 nanodetik pada setiap hop pada 800G, dan retimer menumpuk lebih banyak di atasnya. Kami mengukur total latensi tambahan pada 85 hingga 110 ns pada rakitan AEC yang saat ini kami kirimkan. Untuk tautan struktur daun{10}}tulang belakang, overhead tersebut tidak terlihat dalam kinerja aplikasi. Untuk cluster GPU yang berpasangan erat, ceritanya berbeda. Berdasarkan data pembuatan profil dari tiga penerapan pelanggan yang menjalankan node H100, jika overhead komunikasi tugas pelatihan Anda sudah berada di atas 15%, tambahan seratus nanodetik per hop di beberapa tingkatan switch mulai digabungkan dalam operasi NCCL AllReduce.
Di atas 7 meter, transceiver optik yang dapat dicolokkan untuk 800G adalah satu-satunya jalur yang memungkinkan. Tuntutan lapisan fisik diperketat secara signifikan di sini. Anggaran kerugian penyisipan ujung-ke-di bawah IEEE 802.3ck berada di bawah 1,5 dB untuk sebagian besar kelas jangkauan 800G, dan setiap koneksi MPO yang dikawinkan harus tetap di bawah 0,35 dB. Kami telah melihat serat terpasang yang lulus sertifikasi pada 100G menunjukkan nilai PMD dua hingga tiga kali di atas spesifikasi terukurnya setelah beberapa tahun kompresi pada baki kabel, konsisten dengan apa yang dilaporkan tim peneliti jaringan Juniper pada tahun 2023. Rekomendasi standar kami sebelum penerapan transceiver 800G: jalankan karakterisasi OTDR dan PMD pada setiap segmen serat yang ada. Bukan sampel. Setiap segmen. Biaya untuk-mencabut kembali dua kabel utama hanya sebagian kecil dari biaya proses debug penutup tautan terputus-putus selama enam bulan.
CPO vs LPO vs Pluggable: Posisi Masing-masing Teknologi di Tahun 2026
Optik yang dikemas bersama akan mengubah cara infrastruktur peralihan pusat data dibangun. Kami mengatakan ini sebagai produsen modul yang dapat dicolokkan, jadi anggaplah pandangan kami sebagai informasi, bukan netral.
Pada OFC 2026, data keandalan prototipe CPO menunjukkan potensi tingkat kegagalan yang lebih rendah dibandingkan modul pluggable tradisional. Tanpa siklus penyisipan mekanis atau permukaan konektor terbuka, mode kegagalan dominan pada modul pluggable tidak berlaku. Platform saklar CPO Bailly 51.2T dari Broadcom menunjukkan konsumsi daya sekitar 70% lebih rendah pada lapisan optik dibandingkan dengan konfigurasi pluggable yang setara. (Laporan Interkoneksi Optik DataMIntelligence) NVIDIA menunjukkan-saklar terintegrasi CPO pada peningkatan penerapan penargetan GTC 2026 pada rentang waktu 2027 hingga 2028.
Posisi kami: jika Anda bukan seorang hyperscaler yang membuat silikon sakelar khusus, optik yang dapat dicolokkan adalah satu-satunya pilihan Anda yang dapat diterapkan setidaknya hingga tahun 2027. CPO membutuhkan arsitektur papan yang belum dikirimkan oleh sebagian besar vendor switch, standar konektor yang belum diselesaikan, dan pedoman baru untuk menangani kegagalan yang tidak dapat Anda perbaiki dengan menarik modul. Ekosistem pengadaan perusahaan secara umum belum ada. Kami memiliki dua calon pelanggan dalam satu tahun terakhir yang menunda peningkatan versi 400G-ke-800G karena menunggu CPO. Keduanya akhirnya kembali dan melakukan pemesanan pluggable setelah kesenjangan bandwidth menjadi insiden produksi. Kami menulis tentang alasan teknik untuk posisi ini secara lebih rinci di halaman kamianalisis arsitektur transceiver pluggable.
LPO berada di ruang yang berbeda. Menghapus DSP dari modul akan menghilangkan satu-satunya komponen-yang paling haus daya, yang menyebabkan hingga setengah dari total konsumsi daya modul. Hasilnya adalah konsumsi 30 hingga 50% lebih rendah dan latensi lebih sedikit hingga 15 nanodetik. Kami mulai menerapkan-RFQ spesifik LPO pada akhir tahun 2025. Tiga dari empat RFQ tersebut berasal dari pelanggan yang membuat cluster GPU-vendor tunggal di NVIDIA Spectrum-X. Tidak ada yang mengoperasikan jaringan multi-vendor, yang memberi tahu Anda segalanya tentang tempat kerja PUT saat ini. Jika jaringan Anda menggabungkan vendor switch, PUT tidak kompatibel dengan lingkungan Anda. Jika Anda menjalankan satu cluster AI vendor, ini mungkin merupakan upgrade paling cerdas yang tersedia, dan kami berharap modul siap PUT dapat memenuhi kualifikasi pada pertengahan tahun 2027.
Arti Margin Termal 800G untuk Pemilihan Modul
Perhitungan termal pada 800G membuat orang lengah. Kepadatan daya interkoneksi optik berkecepatan tinggi pada generasi ini menciptakan masalah yang tidak ada pada 400G. Sakelar 64-port yang terisi penuh dengan modul 800G dengan daya 16W masing-masing menggunakan daya transceiver sekitar 1kW, sebelum sakelar milik ASIC sendiri 400 hingga 500W. Itu berarti 1,4 hingga 1,5 kW per sakelar. Delapan sakelar di lapisan belakang memberi Anda daya lebih dari 11 kW hanya dari peralatan jaringan, di rak yang sering kali disediakan untuk total 8 hingga 10 kW.
Juniper Networks secara eksplisit memperingatkan bahwa-modul pihak ketiga dengan penggunaan daya yang tinggi, khususnya jenis ZR dan ZR+ yang koheren, dapat menyebabkan kerusakan termal pada peralatan host, dan tanggung jawab ditanggung oleh pengguna. (FAQ Optik Juniper Networks 800G) Hal tersebut bukan merupakan argumen yang menentang-modul optik pihak ketiga. Ini adalah argumen untuk mengetahui secara pasti apa yang Anda colokkan. Dalam kualifikasi siklus termal kami, kami menguji setiap desain modul 800G pada suhu persimpangan 85 derajat yang berkelanjutan selama 2.000 jam dan melacak penyimpangan arus bias laser sebagai indikator penuaan utama. Unit yang melayang di atas 38 mA ditarik dari jalur produksi. Pada kepadatan 800G, perbedaan antara gambar modul 14W dan satu gambar 18W menentukan apakah rak tetap berada dalam selubung termal atau memicu alarm mati pada pukul 2 pagi. Kesalahan spesifikasi selalu menjengkelkan. Pada tingkat kekuatan ini, biayanya mahal.

Kami mengirimkan modul yang dapat dicolokkan dari 1G SFP hingga 800G OSFP, dan kami mengujinya terhadap platform switch utama. Kami menyimpan catatan tentang apa yang berhasil dan apa yang tidak. Jika Anda memerlukan pemeriksaan kompatibilitas terhadap lingkungan switch tertentu, atau menginginkan spesifikasi termal dan kelas daya untuk rak 800G dengan kepadatan tinggi, teknisi kami menjalankan pembahasan tersebut setiap minggu. KitaOSFP 800G dan QSFP-halaman transceiver DD800memiliki spesifikasi,{0}}opsi kelas jangkauan, dan contoh formulir permintaan untuk setiap modul yang kami kirimkan.


