Amazon, veri merkezlerinde kullanmak üzere tasarladığı yeni ağ mimarisiyle dikkat çekiyor. Şirket, bu yeni sistemin donanım ihtiyacını yüzde 69 oranında azalttığını ve veri iletim hızını yüzde 33 artırdığını duyurdu. Bu yenilikçi teknoloji, rastgele graf teorisine dayalı ilk büyük ölçekli düz ağ dağıtımı olarak öne çıkıyor ve artık Amazon Web Services (AWS) iş yüklerinin çoğu için varsayılan çözüm haline gelmiş durumda.
Resilient Network Graphs (RNG) olarak adlandırılan bu yeni mimari, veri merkezlerinde onlarca yıldır kullanılan hiyerarşik ağ yapılarını daha düz, yarı rastgele bir yapı ile değiştiriyor. Bu sayede sunucular arasındaki veri akışı çok daha verimli hale geliyor. Amazon, yeni tasarımın geleneksel mimarilere kıyasla yüzde 69 daha az ağ cihazı kullandığını ve altyapı maliyetlerini yüzde 45'e kadar azaltabileceğini belirtiyor. Bu durum, şirketin küresel bulut altyapısı genelinde milyarlarca dolarlık tasarruf anlamına gelebilir.
RNG, ilk olarak 2024 yılında Dublin'deki bir veri merkezinde denenmiş, ardından Almanya ve İspanya'daki tesislere yaygınlaştırılmıştır. AWS, bu tasarımın şu anda çoğu yeni veri merkezinde kullanıldığını ve gelecekteki tüm kurulumların temelini oluşturacağını ifade ediyor.
Veri merkezi ve yapay zeka yetenekleri konuşulurken genellikle işlem gücü ve depolama ön plana çıkar. Ancak ağ teknolojileri de en az bunlar kadar kritik bir role sahip. Bir cihazdan bulut tabanlı bir uygulamaya, veritabanına, yapay zeka modeline veya depolama hizmetine gönderilen her istek, binlerce hatta yüz binlerce sunucu arasında hızla veri akışına dayanır. Tesisler büyüdükçe, bilgilerin doğru hedefe hızlı ve verimli bir şekilde ulaşmasını sağlamak giderek zorlaşan bir mühendislik problemi haline gelmiştir.
Onlarca yıldır büyük ölçekli veri merkezleri, "fat-tree" topolojisi olarak bilinen hiyerarşik bir ağ yapısına güvenmiştir. Bu tasarımda veri, ağaç benzeri bir hiyerarşide düzenlenmiş anahtarlar (switch) ve yönlendiriciler (router) katmanlarından yukarı ve aşağı doğru hareket eder. Bu yaklaşım kanıtlanmış ve güvenilir olsa da, darboğazlar oluşturabilir ve mevcut bant genişliğini zorlayabilir. Trafik, ağın başka yerlerinde kapasite boş olsa bile hiyerarşinin belirli noktalarında yoğunlaşabilir. Ayrıca bu yaklaşım çok sayıda pahalı ağ cihazı gerektirir.
Bilim insanları uzun süredir, rastgele graf prensiplerine dayalı daha düz bir ağın bu sorunların çoğunu çözebileceğini teorize etmişlerdir. Trafiği önceden tanımlanmış katmanlardan geçirmek yerine, yönlendiriciler son noktalar arasında sayısız olası yol oluşturan, dağıtılmış bir ağ şeklinde birbirine bağlanır. Teorik olarak bu, dayanıklılığı artırır, mevcut bant genişliğinin kullanımını yükseltir ve tıkanıklık olasılığını azaltır.
Ancak bu tür bir ağı pratik hale getirmek büyük bir zorluk teşkil etmiştir. Rastgele graf ağları on yılı aşkın süredir akademik araştırmaların konusu olsa da, büyük ölçekte başarıyla uygulanmalarının önünde önemli engeller bulunmaktaydı. Bu tür bir ağda trafiği verimli bir şekilde yönlendirmek, öngörülebilir bir hiyerarşide yönlendirmekten çok daha karmaşıktır ve milyonlarca fiber optik bağlantıyı operasyonel bir kabus yaratmadan fiziksel olarak birbirine bağlamak bambaşka bir zorluktur.
AWS, bu engelleri iki ana yenilikle aştığını belirtiyor: yazılım ve özel donanım. İlk yenilik, trafiği öncelikli olarak en kısa yola odaklamak yerine çok sayıda mevcut yol boyunca dağıtan Spraypoint adında özel bir yönlendirme protokolüdür. İkinci yenilik ise, ağı büyük ölçekte inşa etmek için gereken muazzam miktarda kabloyu düzenlemek ve standartlaştırmak üzere tasarlanmış ShuffleBox adlı pasif bir optik cihazdır.
Amazon'a göre, ortaya çıkan mimari verileri geleneksel tasarımlardan yaklaşık üçte bir oranında daha hızlı taşımakla kalmayıp, aynı zamanda önemli ölçüde daha az anahtar ve yönlendirici gerektiriyor. Şirket, bu azalmaların hem sermaye harcamalarını hem de işletme maliyetlerini düşürdüğünü ve aynı zamanda güç tüketimini azalttığını söylüyor.
Yapay zeka modelleri giderek daha büyük ve daha yetenekli hale geliyor, kullanıcı tabanları da aynı şekilde büyüyor. Bu büyümeyi sürdürmek için büyük bulut sağlayıcıların tüm teknoloji yığınını optimize etmeye devam etmesi gerekiyor. Daha hızlı çipler kritik olmaya devam etse de, soğutma, güç dağıtımı, depolama sistemleri, optik ara bağlantılar ve ağ teknolojilerindeki gelişmeler de aynı derecede önemlidir. AWS, RNG'yi bu tür avantajlardan biri olarak görüyor. Şirket, rastgele graf teorisini ölçekte uygulama başarısını "AWS müşterileri için daha büyük güvenilirlik ve performans sağlayacak, donanımda milyarlarca dolar tasarruf edecek ve CO2 emisyonlarını düşürecek bir atılım" olarak nitelendiriyor.