Çin'in 67. TOP500 listesinde zirveye oturan LineShine süper bilgisayarı, 2.198 exaflops'luk performansı ile bir önceki şampiyon El Capitan'ı %20'den fazla geride bıraktı. Ulusal Süper Bilgi İşlem Merkezi'nde (NSCS) Shenzhen'de kurulan ve Shenzhen Bulut Bilişim Merkezi tarafından geliştirilen bu devasa sistem, herhangi bir GPU veya hızlandırıcı kullanmadan bu başarıya ulaştı. Tamamı Çin'de tasarlanmış 13.789.440 çekirdekli silikonlarla çalışan LineShine, sadece CPU gücüyle iki exaflops'u aşan ilk makine olarak tarihe geçti. Bu başarı, aynı zamanda Sunway TaihuLight'tan bu yana Çin merkezli bir sistemin TOP500 listesinde ilk kez lider olması anlamına geliyor.
Sanayileşmiş bir ülkenin Batılı hızlandırıcılar olmadan bir exascale bayrak gemisi inşa edebilmesi etkileyiciyken, daha da dikkat çekici olanı bu sistemin listeye dahil edilmiş olmasıdır. Yıllardır en hızlı sistemlerini sıralamalardan uzak tutan Çin'in, lider bir makineyi gönderme kararı, duruşunda kasıtlı bir değişiklik olduğunu gösteriyor.
Her Şey Yerli Üretim: Çekirdekten İşletim Sistemine
LineShine, NSCS'nin LingKun platformu üzerine kurulu. 20.480 adet hesaplama düğümünün her biri, 1.55 GHz'de çalışan 304 çekirdekli, Armv9 tabanlı LX2 işlemcilerden ikisini barındırıyor. Bu çekirdekler, sekiz adet 38 çekirdekli küme halinde organize edilmiş. Her çekirdek, Arm'ın FP64, FP32, BF16, FP16 ve INT8'i kapsayan Ölçeklenebilir Vektör Uzantısı ve Ölçeklenebilir Matris Uzantısı birimlerini içeriyor.
Her LX2 işlemcisi, 4 TB/s hıza sahip 32 GB'lık paket içi HBM ve 256 GB'a kadar paket dışı DDR5 bellek ile eşleştirilmiş. Bu düzenleme, Japonya'daki Fugaku'nun Fujitsu A64FX'ine, geleneksel sunucu CPU'larından daha yakın bir yapı sunuyor. Düğümler, tescilli LingQi ara bağlantısı ile birbirine bağlanmış ve makine, yerel olarak geliştirilmiş Kylin işletim sistemini çalıştırıyor.
LX2 işlemcisini kimin tasarladığı bilinmiyor, zira NSCS herhangi bir üretici belirtmemiş. Ancak analiz şirketi Jon Peddie Research, bu çipin Huawei tarafından tasarlandığını öne sürüyor ve projenin pilot aşamasının Huawei Kunpeng sunucuları üzerinde çalıştığı rapor ediliyor. Üretim süreci ve fabrikası da henüz doğrulanmamış durumda. AB'den muaf ve TSMC kapasitesine erişim olmaması göz önüne alındığında, SMIC'in 7nm sınıfı sürecinin yerli bir aday olması muhtemel, ancak henüz resmi bir açıklama bulunmuyor.
Yapay Zeka İçin Değil, Saf Hesaplama Gücü
LineShine, bellek ve iletişim ağırlıklı iş yüklerini ödüllendiren ve gerçek bilimsel kodlara daha yakın olan HPCG testinde de 22.00 petaflops ile birinci sırada yer aldı. Ancak yapay zeka eğitimi matematiğini taklit eden karma hassasiyet benchmark'ı olan HPL-MxP'de sadece dördüncü sırada, 7.92 exaflops ile kendine yer bulabildi. Bu skor, FP64 skoruna göre 3.6 katlık bir artış anlamına geliyor.
Başka bir deyişle, Linpack'te geride bıraktığı hızlandırıcı tabanlı makineler, hassasiyet düştüğünde çok daha öne geçiyor. TOP500 duyurusuna göre El Capitan, HPL-MxP'de 16.7 exaflops, yani standart sonucunun 9.2 katı bir performans sergilerken, Aurora ve Frontier de benzer çarpanlar gösteriyor. Düşük hassasiyetli işlem gücü, GPU'ların ve APU'ların CPU'lardan ayrıldığı temel nokta ve LineShine bu alanda belirgin bir dezavantaja sahip.
Güç tüketimi açısından da benzer durumlar gözlemleniyor. LineShine, Linpack çalışmasında 42.220 kW güç tüketiyor ve watt başına 52.07 gigaflops verimlilik sağlıyor. Bu değer, Intel'in Aurora'sından daha iyi olsa da, El Capitan'ın watt başına 60.94 gigaflops'luk değerinin gerisinde kalıyor. Yani LineShine, El Capitan'dan daha fazla toplam FP64 çıktısı üretirken, bunu yapmak için yaklaşık %42 daha fazla güç tüketiyor.
Bu ayrımı göz önünde bulundurmak önemlidir, çünkü TOP500 sıralaması FP64 Linpack'e göre belirlenir; bu da geniş, HBM beslemeli bir CPU'nun hala hızlandırıcılarla rekabet edebildiği tek alandır. LineShine gerçek bir çift hassasiyet şampiyonu olsa da, dünya lideri bir yapay zeka eğitimi makinesi değil ve dördüncü sıradaki HPL-MxP sonucu bunu net bir şekilde gösteriyor.
Peki, Çin Neden Bu Sistemi Sundu?
Çin, en hızlı sistemlerini yaklaşık 2021'den beri TOP500'e sunmayı bıraktı. Bu tarihten sonra Sunway'in Wuxi merkezi ve Sugon, yaptırım listelerine dahil edildi. Topluluk, ülkenin bu sistemden önce de exascale donanıma sahip olduğuna inanıyordu. Örneğin, Sunway'in halefi OceanLight ve NUDT tarafından geliştirilen Tianhe-3, listeye girmeden Gordon Bell Ödülü bilimsel makaleleri aracılığıyla ortaya çıktı. TOP500 kurucularından Jack Dongarra, Çinli araştırmacıların sunum izni verilmediğini ve bu eksikliklerin yetenek eksikliğinden ziyade ABD'nin dikkatinden kaçınma isteğinden kaynaklandığını yıllardır belirtiyor.
Geçen Haziran ayındaki listede Çin HPC'sinin eksikliği özellikle dikkat çekiciydi, ancak LineShine'ın şimdi sunulması bu durumu tersine çevirdi. Sistemin kamu fonu olmadan geliştirildiği ve bu durumun açıklanmasının siyasi riskini azalttığı bildiriliyor. Tamamen yerli tasarım olması, yaptırımların Batı parçalarına olan bağımlılığı ortadan kaldırdığı anlamına geliyor.
HPC analiz firması Intersect360 Research'in CEO'su Addison Snell, Reuters'a yaptığı açıklamada performansın kendisini şaşırtmadığını, asıl sürprizin ise Çin'in sonucu sunma ve bunun tanınmasını isteme kararı olduğunu belirtti. Snell'e göre, tamamen yerli parçalarla çalışan bir numaralı sistem sunmak, yaptırım rejiminin Çin'in önemsediği farkı kapatmadığına dair bir mesaj niteliği taşıyor.
AMD Hâlâ Güçlü
Listenin zirvesi el değiştirmiş olsa da, büyük bir kısmı değişmedi. ABD, El Capitan (1.809 exaflops), Frontier (1.353 exaflops) ve Aurora (1.012 exaflops) ile ilk beşte üç sistemle hala baskınlığını sürdürüyor. Almanya'dan JUPITER Booster ise 1.000 exaflops ile ilk ve tek Avrupa exascale sistemi olarak yerini koruyor.
AMD'nin silikonları, hızlandırılmış sistemlerin çoğunda önemli bir rol oynuyor. Şirketin kendi bloguna göre, bu yıl listeye 191 sistemle dahil olan AMD, bu listede %11'lik bir artış ve yeni girenlerin %41'ini oluşturuyor. El Capitan, Frontier ve İtalyan enerji firması Eni'nin yeni devreye aldığı HPC7 ile üç ilk-10 slotunu elinde bulunduruyor. AMD, ilk-10 performansının %40'ından fazlasına katkıda bulunuyor. Verimlilik açısından ise, Yeşil500 listesindeki sistemlerin %56'sını güçlendiriyor. Ayrıca, İngiltere'deki iki Cambridge Zenith sistemi, şirketin ilk Instinct MI355X konuşlandırmaları olarak 67. ve 68. sıralarda yer alıyor.
LineShine'ın bu tabloyu değiştirmesi pek olası değil, çünkü iki sistem farklı iş yükleri için rekabet ediyor. AMD'nin MI300A ve MI355X parçaları, LineShine'ın dördüncü olduğu karma hassasiyetli yapay zeka işlemleri için tasarlanmış ve Batılı laboratuvarlar da bu alana odaklanıyor, FP64 liderlik pozisyonlarına değil.
El Capitan, Frontier ve Aurora, Linpack sonuçlarının birkaç katı HPL-MxP skorları elde ediyor; bu, LineShine'da bulunmayan donanımlar sayesinde mümkün oluyor. Dolayısıyla, TOP500 tacı Shenzhen'e geçmiş olsa da, bu başarı, Batılı laboratuvarların artık en hızlı makineleriyle peşinde koşmadığı bir benchmark üzerinden gerçekleşti.