NVIDIA’dan Devrim Yaratan Yapay Zeka Modeli: Nemotron 3 Super Açık Kaynak Dünyasını Sallıyor!

NVIDIA'nın açık kaynaklı büyük dil modelleri (LLM) ailesi, Nemotron 3 Super ile önemli bir evrim geçirdi. Yapay zeka ajanlarının iş yüklerine odaklanan bu yeni model, devasa bağlam penceresiyle dikkat çekiyor.

Nemotron 3 Super, Mamba-MoE Mimarisini Kullanarak 1 Milyon Tokenlik Geniş Bir Bağlam Penceresi Sunuyor

Açık kaynak yapay zeka modelleri dünyasında önde gelen isimler arasında NVIDIA'nın Nemotron serisi de yer alıyor. Teknolojinin "beş katmanlı bir pasta" gibi dağıldığı günümüzde, NVIDIA sadece altyapı ve çip alanlarında değil, aynı zamanda açık kaynak modellere de büyük yatırımlar yaparak Batı'da bu alanda öne çıkan nadir şirketlerden biri konumunda. Bu doğrultuda NVIDIA, özellikle yapay zeka ajanlarının (agentic AI) büyük ölçekte çalıştırılmasını hedefleyen Nemotron 3 Super'ı tanıttı.

Nemotron 3 Super'ın öne çıkan yönlerinden biri, NVIDIA'nın hibrit Mamba-MoE mimarisini kullanması. Geleneksel MoE modellerine kıyasla Mamba, oldukça etkileyici bir teknoloji. NVIDIA, LLM'lerin veri akışını yorumlama biçimini değiştirerek, Mamba'nın veriyi doğrusal olarak okumak için Durum Uzay Modeli'nden (SSM) yararlanmasını sağlıyor. Bu, büyük bir bağlam penceresinin gereksiz bilgilerle dolmasını engelliyor. Mamba-MoE, Nemotron 3 Super'ın kullanıcı iş yükleri için optimal bir bağlam penceresi korumasını sağlayarak en iyi ajan tepkilerini sunuyor.

Mamba katmanları, %400 daha yüksek bellek verimliliği ve gelişmiş akıl yürütme yetenekleri sunarak Nemotron 3 Super'ı çıkarım (inference) iş yükleri için ideal hale getiriyor. Bir diğer etkileyici özellik ise 1 milyon tokenlık bağlam penceresi; bu, önceki modelin dört katı büyüklüğünde. Ajan sistemlerinde yaygın bir kural vardır: bağlam penceresi ne kadar büyükse, tepkiler o kadar iyidir. Bu açıdan bakıldığında, Nemotron 3 Super sadece 120 milyar parametre ile sınırlı olmasına rağmen, diğer açık kaynak LLM'lerin çoğunu geride bırakıyor ve hatta bazı gelişmiş modellere yaklaşıyor.

NVIDIA, Nemotron 3 Super'ı ajan iş yüklerini değerlendirmek için kullanılan bir test paketi olan PinchBench üzerinde denedi ve model, testin tamamında %85,6 puan alarak rakiplerini geride bıraktı. Kimi 2.5, Opus 4.5 ve GPT-OSS 120b gibi modellerden daha iyi bir performans sergiledi. Özellikle yapay zeka ajanlarını yoğun kullananlar için Nemotron 3 Super, tek bir GPU ile bile karşılanabilecek işlem gücü gereksinimleriyle yepyeni bir performans sınıfı sunuyor.

Nemotron 3 Super, gelişmiş yapay zeka ajan sistemlerinin gelecekte ne kadar kapsamlı olacağının bir örneğini teşkil ediyor. İlginçtir ki, LLM'ler artık işlem gücü sınırlamalarını da aşarak, uç cihazlarda (edge) model dağıtımının geleceğini daha da parlak hale getiriyor.

Nemotron 3 Super, Mamba-MoE Mimarisini Kullanarak 1 Milyon Tokenlik Geniş Bir Bağlam Penceresi Sunuyor

İlker Özgül

Nvidia'dan Yapay Zeka Arenasına Yeni Hamle: NemoClaw Geliyor!

Xbox'tan Yeni Nesil Müjdesi: Project Helix Geliştirme Kitleri 2027'de Dağıtılıyor!

Son Haberler

KATEGORİLER

BAĞLANTILAR

Ara

NVIDIA’dan Devrim Yaratan Yapay Zeka Modeli: Nemotron 3 Super Açık Kaynak Dünyasını Sallıyor!

Nemotron 3 Super, Mamba-MoE Mimarisini Kullanarak 1 Milyon Tokenlik Geniş Bir Bağlam Penceresi Sunuyor

İlker Özgül

Nvidia'dan Yapay Zeka Arenasına Yeni Hamle: NemoClaw Geliyor!

Xbox'tan Yeni Nesil Müjdesi: Project Helix Geliştirme Kitleri 2027'de Dağıtılıyor!

Benzer Haberler:

Son Haberler

KATEGORİLER

BAĞLANTILAR