NVIDIA'nın açık kaynaklı yapay zeka modeli "Nemotron 3 Super", EnterpriseOps-Gym liderlik tablosunda zirveye yerleşerek teknoloji dünyasında büyük yankı uyandırdı. Bu başarı, NVIDIA'nın yazılım alanındaki yetkinliğini bir kez daha gözler önüne seriyor.
NVIDIA, Açık Kaynaklı Nemotron 3 Super ile Hem Donanım Hem de Yazılım Alanında Zirvede!
Bu yılın mart ayında NVIDIA tarafından tanıtılan Nemotron 3 Super, 120 milyar parametreye sahip ve 12 milyar aktif parametre içeriyor. Hibrit MoE (Mixture of Experts) mimarisine dayanan model, önceki Nemotron Super modeline göre 5 kat daha fazla işlem gücü sunarken, 1 milyon tokenlık yerleşik bağlam penceresi ile yapay zeka ajanlarına uzun süreli hafıza kazandırarak yüksek doğruluklu ve uyumlu akıl yürütmeler sağlıyor.
NVIDIA Nemotron 3 Super modelinin öne çıkan özellikleri şunlardır:
- Latent MoE: Tokenları uzmanlara ulaşmadan sıkıştırarak, aynı çıkarım maliyetiyle 4 kat daha fazla uzman çağırabilme.
- Çoklu Token Tahmini (MTP): Tek bir ileri geçişte birden fazla gelecek tokenı tahmin ederek, uzun dizilerin üretim süresini önemli ölçüde azaltır ve yerleşik spekülatif çözünürlüğü etkinleştirir.
- Hibrit Mamba-Transformer Omurgası: Sıra verimliliği için Mamba katmanlarını, hassas akıl yürütme için Transformer katmanlarını entegre ederek, bellek ve hesaplama verimliliğini 4 kat artırarak daha yüksek işlem gücü sunar.
- Yerel NVFP4 Ön Eğitimi: NVIDIA Blackwell için optimize edilmiş olup, bellek gereksinimlerini önemli ölçüde azaltır ve NVIDIA B200 üzerinde FP8'e kıyasla 4 kat daha hızlı çıkarım sağlar, doğruluktan ödün vermez.
- Çoklu Ortam Pekiştirmeli Öğrenme (RL): NVIDIA NeMo Gym ve NVIDIA NeMo RL kullanılarak 21 farklı ortam yapılandırmasında pekiştirmeli öğrenme ile eğitilmiş olup, 1.2 milyondan fazla ortam döngüsüyle desteklenmiştir.
NVIDIA, bugün EnterpriseOps-Gym'de Nemotron 3 Super'ın ilk ve en güncel kıyaslama sonuçlarını paylaştı. Bu kıyaslama, 512 fonksiyonel araçla tamamen etkileşimli ortamlarda 1.150 görevi kapsayan çeşitli modellerin performansını değerlendiriyor. Bu senaryolar, tek bir iş akışını tamamlamak için yapay zeka ajanlarının birden fazla kurumsal sistem ve araç arasında koordine olmasını gerektiriyor.
Açık kaynaklı modeller sıralamasında NVIDIA'nın Nemotron 3 Super'ı, 27.3 puanlık ortalama skoruyla zirveye yerleşti. Model, TEAMS, E-posta ve Hibrit iş akışlarında lider konumdayken, CSM, ITSM ve Drive iş akışlarında da oldukça rekabetçi bir performans sergiliyor. Bu başarıyla NVIDIA'nın yapay zeka modeli, 2. sırada yer alan Kimi-K2.5 ve 3. sırada bulunan DeepSeek v3.2'yi geride bıraktı. GPT-OSS-120B modeli ise 5. sırada yer alıyor.
NVIDIA'nın açık kaynaklı yapay zeka modelleri Nemotron serisi Nano, Super ve Ultra'yı içeriyor. Şirket ayrıca, Agnetic AI işlem gücünde 9 kat artış sunan Nemotron 3 Nano Omni'yi de tanıttı. NVIDIA, en yeni yapay zeka modelleriyle hem donanım hem de yazılım yetenekleriyle rakip firmaları geride bırakarak tam bir yapay zeka çözümleri sağlayıcısı olduğunu kanıtlamaya devam ediyor.