Yapay zeka (YZ) alanında donanım devi olarak bilinen NVIDIA'nın CEO'su, şirketlerinin pahalı YZ donanımları üretmelerine rağmen, aynı zamanda dünyanın en düşük maliyetli token'larını da ürettiklerini belirtti. Bu durum, YZ'nin temel yapı taşlarından biri olan token'ların üretim maliyetinin, donanım maliyetinden bağımsız olarak optimize edilebildiğini gösteriyor.
YZ'de NVIDIA'nın Liderliği Sadece Donanımdan Değil, Tam Yığın (Full-Stack) Yaklaşımından Geliyor
NVIDIA CEO'su, gerçekleştirdiği bir etkinlikte yaptığı konuşmada, şirketin neden düşük maliyetli token üretiminde lider olduğunu açıkladı. Token'lar, YZ modellerinin yanıt üretmek için işlediği temel birimler olarak düşünülebilir. Bir nevi YZ dilinin alfabe harfleri gibidirler.
Token'ların üretilme hızı, hem donanıma hem de yazılıma bağlıdır. Sadece yüksek performanslı donanımla çok sayıda token üretmek mümkün olsa da, bu YZ için verimli bir yöntem değildir. Token üretimini desteklemek için iyi bir yazılım yığınına ihtiyaç duyulur. Yazılım destekli bir yaklaşımla, donanım doğru bir şekilde kullanılarak daha fazla token üretilebilir.
İşte bu noktada NVIDIA'nın CUDA platformu devreye giriyor. Şirket, CUDA ekosistemini geliştirmek için yıllarca mühendislik bilgisi biriktirerek, donanımlarının token üretimi için en iyisi olarak kabul edilmesini sağladı.
NVIDIA, geleceğin tam yığın yaklaşımında olduğuna inanıyor; yani yazılım, donanım ve uygulamaların bir araya gelerek YZ liderliğini sağlaması gerekiyor. Bu yeni dönemin bir sonraki sınırı ise YZ alanında fırtına gibi esen Ajan Yapay Zeka (Agentic AI) olarak görülüyor.
NVIDIA CEO'su, YZ makinelerinin pahalı olduğunu kabul etmekle birlikte, aynı zamanda dünyanın en düşük maliyetli token'larını ürettiklerini vurguladı. Bu nasıl mümkün oluyor? Basitçe ifade etmek gerekirse, Blackwell veya gelecekteki Rubin platformları gibi NVIDIA'nın YZ sistemleri milyonlarca dolara mal olsa da, milyarlarca dolar gelir elde etme potansiyeline sahip. Bu durum, düşük maliyetli token üretimi için çelişkili görünebilir. Ancak aynı makineler, benzeri görülmemiş sayıda token üretebiliyor. Her bir NVIDIA sistemi tarafından üretilen token başına maliyet en düşük seviyede ve verimlilik de göz önüne alındığında, her sistem aynı zamanda en düşük token/Watt oranını sunuyor.
Bu durum, CEO'nun bahsettiği tam yığın yaklaşımını açıkça ortaya koyuyor. NVIDIA, YZ'nin Toplam Sahip Olma Maliyeti'ni (TCO) anlamak için tamamen yeni bir yöntem geliştirmiş durumda ve bu yaklaşım da token başına maliyet etrafında dönüyor. Yeni metriğin temel prensibi, YZ sistemlerinin üretebileceği maksimum token hızına bakmak yerine, bir token üretirken sistemin maliyeti ve gücünün dikkate alınması gerektiğidir.
Ajan Yapay Zeka döneminin başlamasıyla birlikte, NVIDIA önünde büyük zorluklar var. Rakipler kendi çözümlerini geliştirirken, tedarik zinciri kısıtlamalarını aşmak daha da zorlaşıyor. Ancak NVIDIA'nın YZ stratejisini belirlediği uzun yıllar boyunca şirket sadece başarı elde etti ve bu durum bugün de devam ediyor.