Microsoft, yapay zeka (AI) alanında çığır açacak yeni hızlandırıcı çipi Maia 200'ü tanıttı. Şirket yetkililerine göre, bu yeni çip, Google ve Amazon gibi rakiplerin donanımlarından üç kat daha güçlü bir performans sunuyor.
Maia 200, yapay zeka modellerini eğitmek yerine, mevcut veriye dayalı tahminler yapan, soruları yanıtlayan ve çıktı üreten sistemleri güçlendiren yapay zeka çıkarımı (inference) için kullanılacak.
Microsoft'un ABD'deki merkezi veri merkezlerinde şimdiden kullanıma sunulan Maia 200, sentetik veri üretimi ve gelişmiş dil modellerini (LLM) iyileştirmek için güçlendirici eğitimlerde görev alacak. Bu yapay zeka hızlandırıcısı ayrıca Microsoft Foundry ve 365 Copilot AI'ı destekleyecek ve şirketin Azure bulut platformu aracılığıyla sunduğu altyapının önemli bir parçası olacak.
Microsoft'un bulut ve yapay zeka başkan yardımcısı Scott Guthrie'nin blog yazısında belirttiğine göre, yeni çip saniyede 10 petaflop (1015 kayan nokta işlemi) üzerinde bir performans sağlıyor. Bu, süper bilgisayar performansının ölçüldüğü bir birim olup, dünyanın en güçlü süper bilgisayarlarının 1.000 petaflop gücün üzerine çıkabildiği bir ölçek.
Maia 200, yapay zeka performansını hızlandırmak üzere tasarlanmış son derece sıkıştırılmış bir model olan '4-bit hassasiyet (FP4)' kategorisinde bu performans seviyesine ulaştı. Çip ayrıca 8-bit hassasiyet (FP8) seviyesinde 5 PFLOPS performans sunuyor. FP4, daha enerji verimli olsa da FP8'e göre biraz daha az hassasiyet sunuyor.
Guthrie, “Pratik anlamda, tek bir Maia 200 düğümü, bugünün en büyük modellerini rahatlıkla çalıştırabilir ve gelecekteki daha büyük modeller için bile yeterli kapasiteye sahiptir,” diyerek Maia 200'ün, üçüncü nesil Amazon Trainium'un FP4 performansının 3 katını ve Google'ın yedinci nesil TPU'sunun FP8 performansının üzerinde bir değer sunduğunu vurguladı.
Yeni Nesil Çiplere Büyük Güven
Maia 200, gelecekte daha büyük dil modellerini çalıştırmak gibi özel yapay zeka iş yükleri için potansiyel taşıyor. Şu ana kadar Microsoft'un Maia çipleri yalnızca Azure bulut altyapısında, özellikle Copilot gibi Microsoft'un kendi yapay zeka servisleri için büyük ölçekli iş yüklerini çalıştırmak amacıyla kullanıldı. Ancak Guthrie, gelecekte daha geniş müşteri erişilebilirliği olacağının sinyallerini verdi. Bu, diğer kuruluşların Azure bulutu aracılığıyla Maia 200'den faydalanabileceği veya çip teknolojisinin gelecekte bağımsız veri merkezlerinde veya sunucu yığınlarında yerini alabileceği anlamına geliyor.
Microsoft, Taiwan Semiconductor Manufacturing Company (TSMC) tarafından üretilen 3 nanometre süreci sayesinde mevcut sistemlere göre dolar başına %30 daha iyi performans elde ettiğini belirtiyor. Bu da Maia 200'ün, en zorlu yapay zeka iş yükleri için mevcut çiplerden daha uygun maliyetli ve verimli olabileceği anlamına geliyor. Bu çip, her birinde 100 milyar transistör barındırabiliyor.
Maia 200, daha iyi performans ve verimliliğin yanı sıra birkaç ek özelliğe de sahip. Örneğin, yapay zeka modelinin ağırlıklarını ve verilerini yerel olarak tutmaya yardımcı olabilecek bir bellek sistemi içeriyor. Bu sayede bir modeli çalıştırmak için daha az donanıma ihtiyaç duyuluyor. Ayrıca mevcut veri merkezlerine hızlı entegrasyon için tasarlanmış durumda.
Maia 200, yapay zeka modellerinin daha hızlı ve verimli çalışmasını sağlayacak. Bu durum, Azure OpenAI kullanıcıları olan bilim insanları, geliştiriciler ve şirketler için yapay zeka uygulamaları geliştirirken ve GPT-4 gibi araçları kullanırken daha yüksek işlem hacmi ve hız anlamına geliyor.
Bu yeni nesil yapay zeka donanımının, Maia 200'ün tüketici düzeyindeki donanımlar yerine veri merkezleri için tasarlanmış olması nedeniyle, yakın gelecekte çoğu insan için günlük yapay zeka ve sohbet botu kullanımlarını doğrudan etkilemesi beklenmiyor. Ancak son kullanıcılar, Copilot ve Windows ile Microsoft ürünlerine entegre edilen diğer yapay zeka araçlarındaki daha hızlı yanıt süreleri ve potansiyel olarak daha gelişmiş özellikler aracılığıyla Maia 200'ün etkisini hissedebilir.
Maia 200 ayrıca, Microsoft'un platformları aracılığıyla yapay zeka çıkarımı kullanan geliştiriciler ve bilim insanları için bir performans artışı sağlayabilir. Bu da büyük ölçekli araştırma projelerindeki yapay zeka dağıtımının iyileştirilmesine ve gelişmiş hava durumu modellemesi, biyolojik veya kimyasal sistemler ve bileşimler gibi alanlarda ilerlemelere yol açabilir.