Google, yapay zeka alanındaki en yeni atılımını, 'Ironwood' adını verdiği yeni nesil TPU (Tensor İşlem Birimi) platformuyla gözler önüne serdi. Hot Chips 2025 etkinliğinde yapılan sunumda, bu devasa işlemci gücünün nasıl ölçeklendiği detaylı bir şekilde paylaşıldı.
Google'ın Ironwood 'Yeni Nesil TPU' Platformu Önceki Nesillere Göre Muazzam Bir Performans Artışı Sağlıyor, Özellikleri ve Mimari Detaylandırıldı
Kod adı 'Ironwood' olan 7. Nesil TPU mimarisi, bu yılın Nisan ayında tanıtılmıştı ve o günün en güçlü süper bilgisayarlarının 24 katı performans sunduğu belirtilmişti. Google, Hot Chips 2025'e geçmiş TPU sistemlerinin bir özetini sunarak ve zaman içindeki gelişimlerini anlatarak başladı.
2022 yılında Google, tek bir podda 4096 çip, 32 GB 1.2 TB/s HBM bellek ve çip başına 275 TFLOPs hesaplama gücü sunan TPU v4'ü piyasaya sürmüştü. Bir yıl sonra, 8960 çip, 95 GB 2.8 TB/s HBM bellek ve 459 TFLOPs hesaplama çıktısı ile TPU v5p'yi tanıttılar. Bu yıl ise Ironwood TPU Superpod, pod başına 9216 çip, 192 GB 7.4 TB/s HBM bellek ve çip başına devasa 4614 TFLOPs pik performans ile karşımıza çıkıyor. Bu, TPU v4'e göre 16 kattan fazla bir artış anlamına geliyor.
Google, ardından Ironwood Superpod ve Max-scale küme yapılarına derinlemesine bir bakış sunuyor. Bu sistemin temel taşı Ironwood SoC (System on Chip). Dört adet bu çipten Ironwood PCBA anakartında yer alıyor ve ardından Ironwood TPU rack'lerine entegre ediliyor. Bir Ironwood TPU rack'i, tepsiler halinde toplam 16 Ironwood PCBA'yı üst üste koyarak 64 çiplik bir çözüm sunuyor.
Sıradaki adım ise ara bağlantı çözümü. Google, ölçek büyütme ağı olan InterChip Interconnect veya ICI'yi kullanıyor. Bu ağ, 1.8 Petabaytlık bir ağ üzerinden bağlanan 43 adet Superpod bloğuna (bir blok 64 çipten oluşur) kadar ilerlemelerine olanak tanıyor. Dahili iletişim, çeşitli ağ arayüz kartları (NIC'ler) kullanılarak yönetiliyor.
Google bu bileşenlerle süper podda bir dizi rack sunuyor. İlk olarak 144 rack'ten oluşan Ironwood Superpod karşımıza çıkıyor; ardından birden fazla blokta ölçek büyütme ICI'yi etkinleştirmek için kullanılan optik anahtar şasisi ve son olarak soğutucu dağıtımı için kullanılan CBU rack'i bulunuyor.
Rack'in kendisine gelince, Google en azından son üç nesildir TPU'ları için 3D Torus düzenini kullanıyor. Her mantıksal yapı bloğu, tek bir rack'e paketlenen 64 çip veya düğümden oluşan 4x4x4'lük bir 3D ağdan meydana geliyor.
Ara bağlantı, PCB ticaretleri, bakır pasif bağlantılardan kablolara ve pad panellerine bağlanan optik bağlantılar veya fiber olmak üzere daha hibrit bir yaklaşım benimsiyor. Bu, birimin oldukça esnek olmasını sağlıyor.
Rack'in en üst kısmında, herhangi bir sıvı duvar manifold sızıntısını tespit etmek için kullanılan üst damlama tepsisi yer alıyor ve hemen altında güç dağıtımı bulunuyor. Bu kısım, iki güç alanından 416 volt AC alıp doğrultucular kullanarak AC'yi DC'ye dönüştürüyor. Tüm ünite sıvı soğutma özelliğine sahip ve tamamen dolu bir sistem, tek bir çalıştırmada 100 kW'ın üzerinde güç sağlayabiliyor. Ironwood TPU konuşmaları bu bilgilerle sona eriyor.