Yapay zeka hizmetlerinin abonelik modeli üzerinden sunulmasının maliyeti, yapay zeka şirketleri için giderek artıyor. Özellikle, token başına maliyetin düşüşü, token kullanımındaki ani yükselişle başa çıkamıyor. Yapılan analizlere göre, önde gelen yapay zeka sağlayıcılarının sunduğu abonelikler, kullanıcıların modelleri maksimum düzeyde kullandığında ortaya çıkan gerçek maliyetten çok daha ucuz. Örneğin, bir abonelik aylık 200 dolar olsa da, bu hizmeti tam kapasiteyle kullanmak ayda binlerce dolarlık ek maliyet anlamına gelebiliyor.
Kullanım oranları arttıkça şirketlerin zarar etmeye başladığı görülüyor. Bazı firmalar, düşük kullanım oranlarında bile zarar etmezken, en üst düzey hizmetlerinde kullanım yüzde 10'u aştığında karlılıkları sıfıra inebiliyor. Bu durum sürdürülebilir değil. Hizmetlerin fiyatlarını artırmak veya özellikleri kısmak ise şirketler için zorlu bir seçenek.
Ancak, yeni modellerin geliştirilmesi ve veri merkezlerinin sayısının artmasıyla mevcut modelleri çalıştırma maliyetlerinin düşmesi bekleniyor. Bu düşüş, bazı modellerin daha uygun fiyatlı hale gelmesini sağlayabilir. Bununla birlikte, en yeni ve en gelişmiş modellerin, çalıştırılmasının hala çok pahalı olacağı ve bu nedenle en son özelliklerin yalnızca API erişimi ile sınırlı kalabileceği öngörülüyor. Bu da kullanıcıların bu gelişmiş özellikler için token bazında ödeme yapması gerekeceği anlamına geliyor.
Pahalı Gelişmiş Modeller Şirketleri Başka Yerlere Bakmaya Zorluyor
Abonelik katmanları, API erişimine göre daha uygun fiyatlı olsa da, yapay zeka modellerinin tam potansiyelinden yararlanmak için hala API erişimi gerekiyor. İşte tam da burada bütçeler zorlanıyor. Güçlü ajan yapay zekalar, ortalama bir modele göre bin kat daha fazla token kullanabiliyor. Bu durum, büyük teknoloji şirketlerinin de “token maksimizasyonundan” uzaklaşmasına neden oluyor, çünkü maliyetler kontrol dışına çıkıyor. Hatta bir şirket, aylık kullanım limitini belirlemeyi unuttuğu için tek bir ayda milyonlarca dolar harcamış.
Bu nedenle, bazı şirketler bu pahalı gelişmiş modeller yerine, daha ucuz ve erişilebilir alternatiflere yönelmeye başladı. Bunlar arasında DeepSeek gibi Çin yapımı açık kaynaklı modeller de bulunuyor. Yapılan araştırmalar, yapay zeka ajanlarının gerektiğinde farklı modeller arasında geçiş yapmasına izin vererek maliyetleri yüzde 95'e kadar azaltabileceğini gösteriyor. Uzmanlar, artık her iş için en gelişmiş modele ihtiyaç duyulmadığını, açık kaynaklı modellerin de oldukça yetenekli olduğunu ve yapay zekadan yüksek ücret talep etme eğiliminin azalacağını belirtiyor.
Yapay zeka destekli kişisel asistan hizmetleri sunan bir girişimin kurucusu, şirketinin Sonnet kadar yetenekli olan ancak maliyeti on kat daha düşük olan DeepSeek V4'e geçtiğini belirtiyor. Bu ucuz modelin şirkete milyonlarca dolar kazandırdığını söyleyen kurucu, en karmaşık işler için hala gelişmiş modelleri kullandıklarını ancak genel maliyetlerinde önemli bir düşüş sağladıklarını ifade ediyor.
Diğer şirketler ise kendi yapay zekalarını, özel ihtiyaçlarına göre uyarlanmış ve şirket içi verilerle eğitilmiş açık kaynaklı modellerle geliştirmeye başlıyor. İlk başta karmaşık ve maliyetli görünse de, uzun vadede üçüncü taraf sağlayıcılara olan bağımlılığı ortadan kaldırarak önemli ölçüde tasarruf sağlayabiliyor. Hatta bazıları, şirketin özel ihtiyaçları ve uygulamaları için tasarlanan bu modellerin, gelişmiş modelleri bile geride bırakabileceğini iddia ediyor.
Daha uygun fiyatlı modellerin ve yalnızca gerektiğinde pahalı seçenekleri kullanan operasyonel maliyetleri optimize eden yapay zeka ajanlarının yaygınlaşması, yapay zeka sağlayıcıları üzerinde fiyatlarını düşürme baskısı oluşturuyor. Önde gelen yapay zeka şirketlerinin CEO'ları da artan yapay zeka token maliyetleri konusundaki endişelerini dile getirerek, kullanıcıların daha az harcama ile daha fazla değer elde etmelerini sağlamak için çözümler aradıklarını belirtiyor.