Yapay zeka (YZ) GPU kümelerinin sürekli büyümesiyle ortaya çıkan yoğun iletişim talebi, ağ katmanları boyunca ışık tabanlı iletişime geçişi hızlandırıyor. Bu yılın başlarında Nvidia, yeni nesil raf ölçekli YZ platformlarının daha yüksek aktarım hızları ve daha düşük güç tüketimi için entegre optikli (CPO) silikon fotonik ara bağlantıları kullanacağını duyurmuştu. Bu yılki Hot Chips konferansında Nvidia, yeni nesil Quantum-X ve Spectrum-X fotonik ara bağlantı çözümleri hakkında ek bilgiler paylaştı ve bu teknolojilerin 2026'da piyasaya sürüleceğini belirtti.
Nvidia'nın yol haritası, büyük olasılıkla TSMC'nin üç aşamalı COUPE (Compact Universal Photonic Engine) yol haritasını yakından takip edecek. İlk nesil, OSFP konektörleri için 1.6 Tb/s veri aktarımı sağlarken güç tüketimini azaltan bir optik motor sunuyor. İkinci nesil, anakart düzeyinde 6.4 Tb/s'ye olanak tanıyan CoWoS paketlemeye ve entegre optiklere geçiş yapacak. Üçüncü nesil ise işlemci paketleri içinde 12.8 Tb/s'yi hedefleyerek güç ve gecikmeyi daha da düşürmeyi amaçlıyor.
Neden CPO?
Büyük ölçekli YZ kümelerinde, binlerce GPU'nun tek bir sistem gibi davranması gerekiyor. Bu durum, bu işlemcilerin nasıl birbirine bağlanacağı konusunda zorluklar yaratıyor. Her rafın kısa bakır kablolarla birbirine bağlı kendi üst düzey anahtarına (Top-of-Rack) sahip olması yerine, anahtarlar sıranın sonuna taşınarak birden fazla raf boyunca tutarlı, düşük gecikmeli bir bağlantı oluşturuluyor. Bu yer değişikliği, sunucular ve ilk anahtarları arasındaki mesafeyi büyük ölçüde uzatıyor. Bu da bakırın 800 Gb/s gibi hızlarda pratik olmamasına neden oluyor. Bu nedenle, hemen hemen her sunucu-anahtar ve anahtar-anahtar bağlantısı için optik bağlantılar gereklidir.
Bu ortamda tak-çalıştır optik modüllerin kullanılması, belirgin sınırlamalar getiriyor: Bu tür tasarımlarda veri sinyalleri ASIC'ten çıkıyor, kart ve konektörler üzerinden seyahat ediyor ve ancak o zaman ışığa dönüştürülüyor. Bu yöntem, 200 Gb/s'lik kanallarda yaklaşık 22 desibele kadar ciddi elektriksel kayıplara neden oluyor. Bu da karmaşık işlemeler gerektiren ve port başına güç tüketimini 30W'a çıkaran (bu da ek soğutma gerektirir ve potansiyel bir hata noktası oluşturur) bir telafi gerektiriyor. Nvidia'ya göre, YZ dağıtımlarının ölçeği büyüdükçe bu durum neredeyse dayanılmaz hale geliyor.
CPO, optik dönüştürme motorunu anahtar ASIC'inin yanına yerleştirerek geleneksel tak-çalıştır optik modüllerin dezavantajlarını ortadan kaldırıyor. Böylece, uzun elektriksel izler üzerinden seyahat etmek yerine, sinyal neredeyse anında fiber optiğe bağlanıyor. Sonuç olarak, elektriksel kayıplar 4 desibele düşüyor ve port başına güç tüketimi 9W'a indiriliyor. Bu tür bir düzenleme, arızalanabilecek çok sayıda bileşeni ortadan kaldırıyor ve optik ara bağlantıların uygulanmasını büyük ölçüde basitleştiriyor.
Nvidia, geleneksel tak-çalıştır alıcı-vericilerden uzaklaşarak ve optik motorları doğrudan anahtar silikonuna entegre ederek (TSMC'nin COUPE platformu sayesinde), verimlilik, güvenilirlik ve ölçeklenebilirlik açısından çok önemli kazanımlar elde ettiğini belirtiyor. Nvidia'ya göre, tak-çalıştır modüllere kıyasla CPO'lardaki iyileştirmeler göz alıcı: 3,5 kat daha fazla güç verimliliği, 64 kat daha iyi sinyal bütünlüğü, daha az aktif cihaz sayesinde 10 kat daha fazla dayanıklılık ve daha basit servis ile montaj sayesinde yaklaşık %30 daha hızlı kurulum.
Ethernet ve InfiniBand için CPO
Nvidia, hem Ethernet hem de InfiniBand teknolojileri için CPO tabanlı optik ara bağlantı platformlarını piyasaya sürecek. İlk olarak şirket, 2026'nın başlarında Quantum-X InfiniBand anahtarlarını tanıtmayı planlıyor. Her anahtar, her biri 800 Gb/s hızında çalışan 144 portu destekleyen 115 Tb/s bant genişliği sunacak. Sistem ayrıca, ağ içi işlemede 14,4 TFLOPS'a sahip bir ASIC ve toplu işlemler için gecikmeyi azaltan Nvidia'nın 4. Nesil Ölçeklenebilir Hiyerarşik Toplama Azaltma Protokolü'nü (SHARP) destekleyen bir ASIC içeriyor. Anahtarlar sıvı soğutmalı olacak.
Paralel olarak Nvidia, Spectrum-X Fotoniği platformu ile CPO'yu Ethernet'e entegre etmeye hazırlanıyor. Bu platform, Spectrum-6 ASIC'ini kullanacak ve iki cihazı güçlendirecek: SN6810, 128 adet 800 Gb/s port ile 102.4 Tb/s bant genişliği sağlıyor; daha büyük olan SN6800 ise aynı hızda 409.6 Tb/s ve 512 porta kadar ölçeklenebiliyor. Her ikisi de sıvı soğutma kullanacak.
Nvidia, CPO tabanlı anahtarlarının, giderek büyüyen ve daha karmaşık hale gelen üretken yapay zeka uygulamaları için yeni YZ kümelerini destekleyeceğini öngörüyor. CPO kullanımı sayesinde bu tür kümeler, binlerce ayrı bileşeni ortadan kaldırarak daha hızlı kurulum, daha kolay servis ve bağlantı başına daha düşük güç tüketimi sunacak. Sonuç olarak, Quantum-X InfiniBand ve Spectrum-X Fotoniği kullanan kümeler, çalışmaya başlama süresi, ilk belirteç süresi ve uzun vadeli güvenilirlik gibi metriklerde iyileştirmeler sunacak.
Nvidia, entegre optiklerin isteğe bağlı bir geliştirme değil, gelecekteki YZ veri merkezleri için yapısal bir gereklilik olduğunu vurguluyor. Bu durum, şirketin optik ara bağlantılarını, rakip AMD gibi firmaların raf ölçekli YZ çözümlerine karşı önemli avantajlar olarak konumlandıracağı anlamına geliyor. Tabii ki bu durum, AMD'nin Enosemi'yi satın almasının da nedeni.
İleriye Bakış
Nvidia'nın silikon fotonik girişimindeki önemli bir nokta, evriminin TSMC'nin COUPE (Compact Universal Photonic Engine) platformunun evrimiyle sıkı bir şekilde uyumlu olmasıdır. Bu platformun gelecekte gelişmesi, Nvidia'nın CPO platformlarını da iyileştirecektir. TSMC'nin 1. Nesil COUPE'si, şirketin SoIC-X paketleme teknolojisini kullanarak 65nm elektronik entegre devresini (EIC) bir fotonik entegre devre (PIC) ile istifleyerek üretilir.
TSMC'nin COUPE yol haritası üç aşamada ilerliyor. İlk nesil, OSFP konektörleri için 1.6 Tb/s veri aktarımı sağlayan ve güç tüketimini azaltan bir optik motor sunuyor. İkinci nesil, anakart düzeyinde 6.4 Tb/s'ye olanak tanıyan CoWoS paketlemeye ve entegre optiklere geçiş yapıyor. Üçüncü nesil ise işlemci paketleri içinde 12.8 Tb/s'yi hedefleyerek güç ve gecikmeyi daha da düşürmeyi amaçlıyor.