Anthropic'in büyük merakla beklenen ve ilk olarak nisan ayında duyurulan oldukça yetenekli yapay zeka modeli Claude Mythos, nihayet genel kullanıma hazır hale geldi. Yapay zeka dünyasında heyecan yaratan bu gelişmenin ardından, teknoloji meraklıları bu yeni gücün neler yapabileceğini görmek için sabırsızlanıyordu. Anthropic, yaptığı duyuruyla Claude Fable 5'in artık 'genel kullanım için güvenli' olduğunu ve sınırsız Mythos 5 modelinin ise proje ortaklarına siber güvenlik ve biyoloji gibi hassas alanlarda kullanılması için sunulduğunu belirtti.
Her yeni nesil ileri düzey yapay zeka modelinde olduğu gibi Anthropic de, Claude Fable 5'in performansını gösteren bir dizi standart testin sonuçlarını paylaştı. Bu testler, modelin ulaştığı son teknoloji seviyesini vurguluyor. Ancak rakamlardan daha ilgi çekici olan, şirketin bu seviyedeki yetenekler için öne sürdüğü özel kullanım senaryoları.
Örneğin, Stripe'ın 50 milyon satırlık bir Ruby kod tabanının geçişini tek bir gün içinde tamamladığı belirtiliyor. Bu, manuel olarak yapıldığında iki ayı bulabilecek bir ekip çalışması gerektirecekti. Bu denli büyük bir işin bu kadar kısa sürede tamamlanabilmesi, Fable 5 ve Mythos 5'in genel yeteneklerinin yanı sıra, önceki Claude modellerine göre 'daha uzun süreler boyunca otonom çalışabildiğini' gösteriyor.
Görsel görevler söz konusu olduğunda ise Anthropic, Fable 5'in 'yeni nesil en iyi model' olduğunu ifade ediyor. Şirketin açıklamalarına göre model, yalnızca 'minimal bir, yalnızca görsel arayüz kullanarak' Pokemon FireRed oyununu baştan sona oynayabildi. Önceki modellerin, araç çağırma yeteneğine sahip olmalarına rağmen bu görevi tamamlamakta zorlandığı biliniyor.
Wharton School profesörü ve yapay zeka alanında yazı yazan Ethan Mollick da Fable'ın neler yapabileceğine dair çarpıcı örnekler paylaştı. Mollick, modelden, yapılandırılmamış anket yanıtlarının kategorizasyonu ve analizi için 19 sayfalık bir geliştirme dokümanı hazırlamasını istediğini anlatıyor. Modelin 'dokuz buçuk saat' boyunca çalışarak 'araştırmacıların yıllardır ihtiyaç duyduğu ancak üretimi karlı olmayan, son derece gelişmiş' bir araç ürettiğini belirtiyor.
Mythos seviyesindeki yeteneklerin kötü niyetli kişilerin eline geçmesini önlemek amacıyla Anthropic, belirli konulardaki sorguları (özellikle siber güvenlik, biyoloji, kimya veya damıtma gibi alanlarda) bir önceki nesil Claude Opus 4.8 modeline yönlendirecek. Şirket, bu tür yönlendirmelerin gerçekleştiği durumlarda kullanıcıların bilgilendirileceğini ve bu durumun modelle olan etkileşimlerin %5'inden azını kapsayacağını belirtiyor.
Ancak Mollick, bu sınırlamaların 'bir güvenlik sorunu belirtisinin en ufak bir ipucunda bile tetiklendiğini' ifade ederek, iyi niyetli kullanıcıların bile Fable 5'i kod tabanlarının güvenliğini artırmak için kullanamayabileceğini öne sürüyor.
Model kartına göre, Fable 5 ayrıca kullanıcıların en ileri düzey yapay zeka veya makine öğrenimi araştırmalarını ilerletmek için kullanmaya çalıştığı durumlarda da 'sınırlandırılacak'. Bu durumun, şirketin yapay zekanın kendi kendine gelişimi konusundaki son endişelerinin yanı sıra, muhtemelen diğer araştırma laboratuvarları ve jeopolitik aktörlerle olan rekabet endişelerinden de kaynaklandığı düşünülüyor.
Bu sınırlamalar dahilinde Anthropic, Fable 5'in bugün her yerde erişilebilir olduğunu ve API üzerinden girdi token'ları başına 10 dolar, çıktı token'ları başına ise 50 dolardan ücretlendirileceğini bildirdi. Bu rakamlar, şu anki son nesil Opus 4.8'in iki katı ve Sonnet 4.6'nın ise 3 katından biraz fazlası.
Anthropic'in Pro, Max, Team ve Enterprise abonelik planlarına sahip kullanıcılar, 22 Haziran'a kadar Fable 5'e kısa bir ücretsiz erişim döneminden yararlanabilecek. Bu tarihten sonra model erişimi için kullanım kredilerinin ödenmesi gerekecek. Şirket, gerekli hesaplama kapasitesine sahip olduğunda Fable 5 erişimini bu planlar aracılığıyla 'en kısa sürede' yeniden sağlayacağını belirtti.
Yazı hazırlanırken, halka açık bir Mythos sınıfı modelin kullanılabilirliği nedeniyle dünya henüz sona ermedi. Bu seviyedeki yeteneklere ve belirli kısıtlamalara sahip bir yapay zeka modeliyle insanların hangi sorunları çözüp çözemeyeceğini görmek ilginç olacak. Kesin olan tek şey, bundan sonrası daha da tuhaflaşacak.