Yapay zeka alanında çığır açan çalışmalar yapan OpenAI, en yeni Codex modelinin altyapısında önemli bir gelişmeye imza attı. Şirket, popüler yapay zeka modeli Codex'in güncel sürümünün NVIDIA'ya ek olarak Cerebras'ın yapay zeka çiplerini de kullandığını duyurdu. Bu gelişme, yapay zeka çıkarım (inference) süreçlerinde NVIDIA dışındaki alternatiflerin de ne kadar güçlü olabileceğine dair önemli bir ipucu veriyor.
OpenAI, Cerebras'ın Hızlı Bant Genişliğiyle Saniyede 1000 İşlem Hedefine Ulaştı
Yapay zeka finansmanı konusunda NVIDIA ve OpenAI arasında zaman zaman gündeme gelen gelişmeler yaşansa da, hesaplama gücü yarışında OpenAI'ın Cerebras ile olan önceki ortaklığından faydalanarak ilginç bir yol izlediği görülüyor. OpenAI'ın son Codex sürümünde, GPT‑5.3‑Codex‑Spark modelinin Cerebras'ın yapay zeka çipleriyle desteklendiği ve bu donanımın sağladığı düşük gecikme süresinin (latency) çıkarım iş yüklerinde büyük avantajlar sunduğu belirtiliyor. OpenAI'ın bu tercihi, çıkarım alanında NVIDIA için ciddi bir rakibin ortaya çıktığına işaret ediyor.
Standart Codex modelleri ile 'Spark' varyantı arasındaki temel fark, OpenAI'ın bu sürümünü "anlık olarak işleri halletmek" üzere tasarladığını iddia etmesidir. GPT‑5.3‑Codex‑Spark ile model gecikmesinde önemli iyileştirmeler, boru hatlarının (pipeline) optimize edilmesi ve daha da önemlisi Cerebras'ın donanımından yararlanılmasıyla elde edilmiş. OpenAI, bu sürümle ilk token'a kadar geçen süreyi %50 oranında azalttığını belirtiyor ki bu oldukça dikkat çekici bir rakam. Codex-Spark, Cerebras'ın Wafer Scale Engine 3 üzerinde çalışıyor ve bu donanımın getirdiği teknik avantajlar öne çıkıyor.
OpenAI'ın hesaplama gücü için Cerebras'ı tercih etmesinin birkaç nedeni bulunuyor. En önemlilerinden biri, WSE-3 ile OpenAI'ın kodlama gibi bellek ağırlıklı iş yükleri için kritik öneme sahip olan yüksek bellek bant genişliğine ulaşabilmesidir. Bu sayede, Codex-Spark ile OpenAI, "bir insan kodlayıcı ortağı kadar hızlı" olduğu iddia edilen 1000 TPS (saniyede işlem) çıktısı elde edebiliyor. Blackwell'in toplu işlemeye daha fazla odaklandığı ve gecikmeye daha az önem verdiği NVIDIA'nın altyapısı göz önüne alındığında, Spark'ın NVIDIA üzerinde eğitilmesi OpenAI için ekonomik olarak daha az pratik hale geliyor. Bu noktada Cerebras'ın çözümü daha mantıklı görünüyor.
Ancak ölçekli çıkarım söz konusu olduğunda, token'lar (işlem birimi) açısından NVIDIA hakimiyeti bulunuyor. NVIDIA'nın Blackwell ile token maliyetlerini 10 kata kadar düşürdüğüne dair açıklamaları da bu hakimiyeti destekliyor. OpenAI'dan yapılan açıklamalara göre, Cerebras ile şirketin "tamamlayıcı yetenekler" kazandığı belirtiliyor, ancak yapay zeka laboratuvarının hesaplama gücü yarışındaki ana tercihi hala NVIDIA gibi görünüyor. Bununla birlikte, Codex-Spark ile günümüzdeki darboğazın gecikme süresi olduğu ve donanım düzeyinde NVIDIA'nın teknoloji yığınının bu alanda baskın olmak için tam olarak konumlanmadığı açıkça görülüyor.
NVIDIA'nın çıkarım pazarındaki konumunu ilerleyen dönemde nasıl şekillendireceğini görmek ilginç olacaktır. Zira Cerebras, bu segmentte AMD gibi rakipler ve gelişmekte olan özel entegre devre (ASIC) üreticileriyle birlikte ciddi rakiplerden sadece biri.