Apple, yeni işletim sistemlerine gelecek Liquid Design'ı tanıttığı WWDC etkinliğinde, hem cihaz içi hem de bulut tabanlı yeni nesil yapay zeka temel modellerini de duyurdu. Etkinliğin ardından teknoloji devi, modellerinin nasıl eğitildiği ve optimize edildiği hakkında detaylı bir teknik raporla kullanıcıların ve teknoloji dünyasının daha yakından incelemesine olanak tanıdı. Bu rapor, Apple'ın yapay zeka stratejisini daha iyi anlamamızı sağlarken, şirket raporunda modelleri eğitirken gizlilik ve verimliliği ön planda tutan odaklanmış bir yaklaşım benimsediğini vurguluyor.
Apple'ın Yeni Nesil Yapay Zekası: Modeller Nasıl Oluşturuldu ve Eğitildi?
Yapay zeka alanındaki popülerliğinde bir düşüş yaşanmasına rağmen, Apple, temel modellerini detaylandıran ve en yeni yapay zeka modellerinin temel unsurları hakkında derinlemesine bilgi veren "Apple Intelligence Foundation Language Models - Tech report 2025" adlı ayrıntılı bir rapor yayınladı. Bu belge, modelin mimarisinden eğitim süreci, eğitim sonrası işlemler ve ince ayarlar gibi hemen hemen her şeyi kapsıyor. Ayrıca, modellerin teknik olarak geliştirilmesi, daha verimli hale getirilmesi ve gizliliğin korunması için kullanılan yöntemleri de inceliyor.
Apple daha önce geliştiricilerin kullanımına sunduğu cihaz içi yapay zeka modelleri ve 3 milyar parametresi hakkında bilgi paylaşmıştı. Ancak bu modellerin yapısının şimdilik seyrek olduğu belirtiliyordu. Rapora göre, verimliliği artırmak amacıyla model bölümlere ayrılıyor. İlk bölüm, temel yapı taşları olan transformer katmanlarının yüzde 60'ından fazlasını içeren Blok 1 olarak adlandırılıyor. Yapay zeka, bu sayede dilin temel yapısını anlıyor ve yanıtlar üretiyor.
İkinci bölüm ise Blok 2 olarak adlandırılıyor ve çok fazla bellek tüketen anahtar ve değer projeksiyonu gibi iki teknik unsurun çıkarılmasıyla daha hafif hale getirilmiş. Bu strateji sayesinde Apple, modelin yaklaşık yüzde 38 daha az bellek kullanmasını ve yanıt sürelerini hızlandırmasını sağladı. Şirket, yapay zeka modellerinin yerel performansını iyileştirmenin yollarını arıyor ve birkaç yıl önce, bir cihazın belleğinin kaldırabileceğinden daha büyük bir modeli çalıştırma fikrini araştırmıştı. Bu yaklaşımı benimsemese de, donanım sınırlamaları ve diğer zorlukların üstesinden gelmenin yollarını aramaya devam ediyor.
Sunucu tarafındaki yapay zeka modeli için Apple, özel bir mimari kullandı. Bu yaklaşım, büyük yapay zeka modellerini uzmanlar olarak adlandırılan daha küçük parçalara ayıran bir strateji olan Paralel-İzleme Uzmanları Karması (PT-MoE) olarak adlandırılıyor. Uzmanlar Karması'nı kullanarak modelin her seferinde tamamen çalışmasına gerek kalmıyor, bunun yerine yalnızca ilgili uzmana odaklanabiliyor. Alanında uzmanlaşmış modelin yalnızca bir bölümü etkinleştirilerek performans tasarrufu ve verimlilik artışı sağlanıyor.
Apple ayrıca, bağımsız çalışan ve yalnızca kritik noktalarda bir araya gelen birden fazla izi bulunan Paralel İzleyici Transformer adlı yeni bir Transformer mimarisi tasarladı. Bu süreç sayesinde model, sistem genelinde herhangi bir gecikme yaşamıyor. Apple, ayrıca Apple Intelligence'ın en büyük sorunlarından biri olan sınırlı dil desteğini de ortadan kaldırdı.
Yeni modelleriyle çok dilli yeteneklerini önemli ölçüde geliştirdi. Dil desteğini genişletmek için Apple, eğitim sürecindeki İngilizce olmayan verileri yüzde 8'den yüzde 30'a çıkardı. Bu, hem gerçek hem de yapay zeka tarafından üretilen içeriği kapsayarak modelin daha iyi bir anlayışa sahip olmasını ve daha geniş bir dil yelpazesine uyum sağlamasını amaçlıyor. Bu sayede Yazım Araçları gibi özellikler daha iyi çalışabilecek. Yeni yapay zeka sistemlerinin eğitiminde Apple, şirketin kendi web tarayıcısı olan Applebot tarafından toplanan web verilerine büyük ölçüde güveniyor ve bu veri geçmiş modellerde de kullanılmıştı. İlginç olan, Apple'ın gizliliğe saygı duyması nedeniyle, bir web sitesi taranmasını istemezse, içeriği kullanılmıyor.
Şirket, modellerini eğitmek için birden fazla teknik kullanıyor; temel olarak eğitim materyali için genel web verileri kullanılıyor. Apple, ilgisiz içeriği filtrelemeye ve faydalı ve amaca yönelik veri kümelerine odaklanmaya eğilimlidir. Benzer şekilde, teknoloji devi medya şirketlerinin adlarını açıklamamasına rağmen, yayıncıların lisanslı içeriğine de güveniyor. Şirket ayrıca, özellikle görüntü-dil görevleri, kodlar veya talimat takibi gibi konularda daha iyi ince ayar için sentetik veri toplamak üzere daha küçük modeller kullanıyor.
Çoklu yaklaşım, görsel verileri de içeriyor; şirketin ekran görüntüleri ve el yazısı notları dahil olmak üzere 10 milyardan fazla resim-altyazı çifti bulunuyor. Kendi modelleri de daha zengin altyazılar oluşturmak için kullanılıyor. Tüm bu eğitim yöntemleri, Apple'ın daha akıllı ve daha yetenekli modeller oluşturmasına yardımcı oluyor. Apple'ın yapay zeka modellerini eğitme yaklaşımı iyi ifade edilmiş. Sistemin temel değeri olan gizliliğinden ödün vermeden güçlü ve çok yönlü kalmasını sağlayan dengeli bir strateji.