AMD, yüksek başarımlı hesaplama (HPC) ve yapay zeka (AI) alanındaki yeni Instinct MI350X serisi hızlandırıcılarını duyurdu. Yakın zamanda gerçekleşen ISC 2025 etkinliğinde detayları paylaşılan bu çipler, özellikle yapay zeka çıkarım iş yükleri için önemli performans artışları sunarken, amiral gemisi model MI355X'in yüksek güç tüketimi dikkatleri üzerine çekti.
Yeni Instinct MI350X serisi, firmanın CDNA 4 mimarisi üzerine kurulu. Bu mimari, yapay zeka iş yüklerinde giderek daha önemli hale gelen FP4 ve FP6 hassasiyet formatlarının yanı sıra FP8 ve FP16 desteği de getiriyor. AMD, MI350X işlemcilerini öncelikli olarak yapay zeka çıkarımı için tasarladığını belirtiyor.
AMD Instinct MI350X ailesi iki ana modelden oluşuyor: Standart Instinct MI350X modülü 1000W güç tüketimiyle hava soğutmaya uygun tasarlanmışken, daha yüksek performanslı Instinct MI355X modeli 1400W'a kadar güç tüketiyor ve öncelikli olarak doğrudan sıvı soğutma ile kullanılması öneriliyor (ancak AMD, bazı müşterilerin hava soğutma da kullanabileceğini düşünüyor).
Her iki model de 288GB HBM3E bellek ile geliyor ve 8 TB/s'ye kadar bant genişliği sunuyor. Performans tarafında ise MI350X, 18.45 PFLOPS'a kadar FP4/FP6 performansı sunarken, MI355X'in 20.1 PFLOPS'a kadar çıkabildiği belirtiliyor. FP8 hesaplama performansı MI350X için yaklaşık 9.3 PFLOPS, MI355X için ise 10.1 PFLOPS olarak listeleniyor. Önceki nesil MI325X ile kıyaslandığında bu, önemli bir performans artışını işaret ediyor.
AMD'nin teknoloji başkanı, endüstrinin süper bilgisayarlar için daha da güçlü işlemciler ve hızlandırıcılar geliştirmeye devam edeceğine ve on yıl içinde zettascale performansa ulaşılacağına olan güvenini dile getirdi. Ancak bu performans, güç tüketiminde keskin bir artış anlamına gelecek. Örneğin, bir zettascale performans sunan bir süper bilgisayarın 500 MW güç tüketebileceği öngörülüyor – bu, büyük bir enerji santralinin ürettiği güce yakın bir seviye.
Etkinlikte sunulan verilere göre, en iyi süper bilgisayarların hesaplama performansı yaklaşık her 1.2 yılda bir iki katına çıkıyor. Bu üstel büyüme trendi, giderek daha fazla yapay zeka odaklı donanımla sürdürülüyor.
Ancak bu performans artışı, güç tüketimi ve bellek bant genişliği ihtiyacını da beraberinde getiriyor. Sunuma göre, performans artışını sürdürmek için GPU bellek bant genişliğinin her iki yılda bir iki katından fazla artması gerekiyor. Bu da, GPU başına düşen HBM yığınlarının sayısını artırmayı ve dolayısıyla daha büyük, daha fazla güç tüketen GPU'lar ve modüller geliştirmeyi zorunlu kılıyor.
Süper bilgisayarlar için hızlandırıcıların güç tüketimi gerçekten de hızla artıyor. 2023 ortasında tanıtılan bir önceki nesil MI300X'in tepe güç tüketimi 750W iken, bu hafta resmen tanıtılacak olan Instinct MI355X, 1.400W tepe güç tüketimine sahip olacak. Firma yetkilisi, 2026-2027'de 1.600W ve bu on yılın sonlarında 2.000W işlemciler öngörüyor.
İyi haber şu ki, güç tüketimindeki artışa ek olarak, süper bilgisayarlar ve hızlandırıcılar performans verimliliğinde de (GFLOPS/W) hızla gelişiyor. 2010'da yaklaşık 3.2 GFLOPS/W olan verimlilik, günümüz sistemlerinde yaklaşık 52 GFLOPS/W'ye yükseldi.
İleriye dönük olarak, performans ölçeklendirme hızını korumak için enerji verimliliğinin de paralel olarak artması gerekecek. Gelecekteki süper bilgisayarların enerji ihtiyacını karşılamak, mimari atılımların yanı sıra enerji altyapısı konusunda da ciddi planlamalar gerektirecek. Bu bağlamda, büyük ölçekli enerji kaynaklarının, örneğin nükleer enerjinin, süper bilgisayarları beslemek için kullanılması giderek daha fazla dile getirilen bir olasılık haline geliyor.