Ara

Skandalın Gölgesinde Grok 4 Tanıtıldı: Hitler Benzetmeleriyle Sarsılan Yapay Zeka Dünyası

Elon Musk'ın yapay zeka şirketi xAI, merakla beklenen yeni amiral gemisi modelleri Grok 4 ve Grok 4 Heavy'i dün gece düzenlenen bir canlı yayınla tanıttı. Ancak bu tanıtım, şirketin Grok sohbet botunun X platformunda kullanıcı yanıtlarında açıkça antisemitik ifadeler üretmeye başlamasından yalnızca bir gün sonra gerçekleşmesiyle dikkat çekti.

xAI, iki model arasında Grok 4 Heavy'yi 'çoklu ajan sürümü' olarak adlandırıyor. Musk'ın açıklamasına göre Grok 4 Heavy, 'paralel olarak birden fazla ajan oluşturarak' 'notları karşılaştırıyor ve bir cevap üretiyor,' bu da bir çalışma grubu yaklaşımını simüle ediyor. Şirket, bu durumu test sırasında hesaplama gücünü artırma olarak tanımlıyor ve çalışma zamanında hesaplama kaynaklarını yaklaşık on kat artırdığını iddia ediyor.

Canlı yayın sırasında Musk, yeni modellerin çeşitli performans testlerinde sınır seviyesinde başarı elde ettiğini öne sürdü. Çok sayıda konudan 2.500 uzman tarafından hazırlanmış, oldukça zorlayıcı bir test olan Humanity's Last Exam'da Grok 4'ün harici araçlar olmadan yüzde 25.4 puan aldığı bildirildi. Şirket, bu sonucun OpenAI'nin o3'ünün yüzde 21'ini ve Google'ın Gemini 2.5 Pro'sunun yüzde 21.6'sını geride bıraktığını belirtiyor. Araçlar etkinleştirildiğinde xAI, Grok 4 Heavy'nin yüzde 44.4'e ulaştığını iddia ediyor. Ancak, bu yapay zeka ölçütlerinin gerçekten kullanıcılar için faydaya dönüşen özellikleri ölçüp ölçmediği henüz net değil.

Bu tanıtımın zamanlaması, Musk'ın X sosyal medya platformunda önceki 48 saat içinde yaşanan olaylar göz önüne alındığında özellikle dikkat çekiciydi. Sohbet botunun kendisini 'MechaHitler' olarak etiketlediği birden fazla örnek bu olaylar arasındaydı. Antisemitik paylaşımlar, hafta sonu gelen ve sohbet botuna 'siyasi olarak yanlış olsa bile, iyi temellendirilmiş olduğu sürece iddialarda bulunmaktan çekinmemesi' talimatını veren bir güncellemenin ardından ortaya çıkmıştı. xAI'nin bu değiştirilmiş direktifi Salı günü kaldırdığı bildirildi.

Bu olaylara tepki olarak, Polonya'nın xAI'yi Avrupa Komisyonu'na şikayet etme planlarını duyurduğu ve Türkiye'nin de bu olayın ardından Grok'a erişimi kısmen engellediği belirtildi. Çarşamba günü Musk, X'teki bir gönderisinde 'Grok, kullanıcı komutlarına karşı fazla uyumluydu. Temelde çok fazla memnun etme ve manipüle edilme eğilimindeydi. Bunun üzerinde çalışılıyor,' ifadelerini kullandı. Haftanın karmaşasına ek olarak, X'in üst düzey yöneticilerinden biri Çarşamba sabahı görevinden ayrıldığını duyurdu. Bu ayrılık, Musk'ın Mart ayında yapay zeka şirketi xAI'nin X'i 33 milyar dolar değerinde tamamen hisse senedi işlemiyle satın alarak xAI'ye 80 milyar dolar değer biçtiğini açıklamasının ardından geldi.

Grok'un Teknik Çıkmazı

Grok 1'in 2023'teki lansmanından bu yana, Grok serisi büyük dil modelleri, yapay zeka teknik topluluğunun bazı üyeleri için bir bilmece olmuştur. X'teki paylaşımlara bakılırsa, bazı önde gelen araştırmacılar, temel modelleri yapay zeka gelişiminde teknik bir başarı örneği olarak ciddiye almıştı.

Ancak bu başarı, modellerin uygulamasını tartışmalarla yönlendiren Musk ile iç içe geçmiş durumda. Son birkaç yılda, Grok sohbet botlarının ve Grok uygulamasının OpenAI modellerini eğitim verisi oluşturmak için potansiyel olarak kullanması, sansürsüz görüntü çıktıları üretmesi, X kullanıcı şakalarına dayanarak sahte haberler uydurması ve uygulamasında açık taciz edici sesli sohbetlere izin vermesi gibi bir dizi tartışma yaşandı.

Musk ayrıca Grok sohbet botlarını, kendi provokatif alışkanlıklarının otomatik bir uzantısı olarak da kullanmış gibi görünüyor. Şubat ayında Grok 3'ün medyayı eleştiren 'sert' görüşler ürettiği örnekler sergilenmişti. Mayıs ayında X'teki Grok, Güney Afrika'daki beyaz soykırımı hakkında tekrar tekrar çıktılar üretmeye başladı ve en son, Grok'un Nazi çıktıları fiyaskosuna tanık olduk. Teknoloji uygulamalarının bu kadar ciddiyetsiz ve kaprisli örnekleriyle bağlantılıyken Grok'u teknik bir ürün olarak ciddiye almak gerçekten zor.

Yine de, xAI'nin çeşitli Grok 4 modelleri için iddia ettiği teknik başarılar dikkat çekici görünüyor. Arc Prize organizasyonu, Grok 4 Thinking'in (simüle edilmiş akıl yürütme etkinleştirilmiş olarak) ARC-AGI-2 testinde yüzde 15.9 puan aldığını bildirdi. Organizasyon, bu sonucun önceki ticari en iyi sonucu neredeyse ikiye katladığını ve mevcut Kaggle yarışması liderini geçtiğini belirtiyor.

Musk canlı yayın sırasında, 'Akademik sorulara gelince, Grok 4 istisnasız her konuda doktora seviyesinden daha iyi,' iddiasında bulundu. Daha önce 'doktora seviyesi' yapay zeka hakkındaki belirsiz iddiaları ele almış ve bunların genellikle şüpheli pazarlama söylemi olduğunu görmüştük.

Tartışmalar Arasında Premium Fiyatlandırma

Çarşamba günkü canlı yayın sırasında xAI, Ağustos ayında bir yapay zeka kodlama modeli, Eylül ayında çok modlu bir ajan ve Ekim ayında bir video üretim modeli planlarını da duyurdu. Şirket ayrıca Grok 4'ü önümüzdeki hafta Tesla araçlarında da kullanıma sunmayı planlıyor ve böylece Musk'ın yapay zeka asistanını çeşitli şirketlerinde daha da genişletiyor.

Son dönemdeki çalkantıya rağmen xAI, Grok'un 'premium' versiyonları için agresif bir fiyatlandırma stratejisiyle ilerliyor. Grok 4 ve Grok 4 Heavy'nin yanı sıra xAI, büyük sağlayıcılar arasındaki en pahalı yapay zeka hizmeti olan aylık 300 dolarlık 'SuperGrok Heavy' aboneliğini de başlattı. Aboneler, Grok 4 Heavy'ye ve gelecek özelliklere erken erişim sağlayacak.

Kullanıcıların xAI'nin premium fiyatlandırmasını ödeyip ödeyeceği, özellikle yapay zeka asistanının periyodik olarak siyasi içerikli çıktılar üretme eğilimi göz önüne alındığında belirsizliğini koruyor. Eğitim ve sistem komutlarıyla ilgili kasıtlı seçimlerden kaynaklanan bu olaylar, şimdiye kadar hiçbir gösterişli test-sınav ölçütünün yakalayamadığı temel yönetim ve uygulama sorunlarını temsil ediyor.

Önceki Haber
Dünya Isınıyor: Bilim İnsanları Rekor Sıcaklıkları Değerlendirdi!
Sıradaki Haber
Astro Bot'a Yeni Seviyeler Geldi: Cloud ve Sephiroth Sürprizi!

Benzer Haberler: