Yaklaşık on yıl aradan sonra, Standard Performance Evaluation Corporation (SPEC), yaygın olarak kullanılan SPEC CPU benchmark'ının yeni versiyonunu piyasaya sürüyor. SPEC CPU 2026, adından da anlaşılacağı gibi, test paketindeki iş yüklerini modernize ediyor ve SPEC CPU 2017'nin kod tabanını iki katından fazla artıran daha fazla benchmark ekliyor. Ancak en kritik nokta, bu paketin taşınabilirlik göz önünde bulundurularak tasarlanmış olmasıdır. Bu sayede, Raspberry Pi ve Windows-on-ARM dizüstü bilgisayarlardan, benchmark'ın hedeflediği geniş sunucu filolarına kadar her sistemde çalışabiliyor.
Teknoloji meraklıları arasında en çok konuşulan iki SPEC benchmark'ı grafik performansı için SPECviewperf ve CPU incelemelerimizde kullandığımız SPEC Workstation'dır. SPEC CPU ise daha çok sunuculara odaklanan, ancak aynı zamanda oyuncular için en iyi işlemcileri de kapsayan bir test paketidir.
Güncellenen paket, SPEC CPU 2017'ye kıyasla dokuz test daha fazla olmak üzere toplam 52 test içeriyor ve kod satırı sayısı iki katından fazla. SPEC'in yaptığı şeylerden biri de bu. Paket, gerçek uygulamaları kullanıyor, ancak bu uygulamalar benchmark paketi için çeşitli şekillerde modifiye ediliyor. SPEC'in teknik makalesine göre, ana odak noktalarından biri, her uygulamadan tekrarlanabilir sonuçlar elde etmek, yani deterministik olmayan kaynakları ortadan kaldırmak. Örneğin, teknik makalede C++'daki std::sort fonksiyonunun yerine std::stable_sort'un kullanıldığı açıklanıyor.
Teknik makalede, “Temel hedef, benchmark'ın uyumlu herhangi bir sistemde aynı miktarda kullanıcı alanı (user-space) işini yürütmesini ve verilen bir tolerans dahilinde her çalıştırmada aynı sonucu üretmesini sağlamaktır. Bu düzeyde bir titizlik elde etmek için, her bir aday benchmark bir dizi değişikliğe uğrar” deniliyor.
Deterministik olmamanın yanı sıra, SPEC uygulamaları taşınabilir hale getirmek için de değiştiriyor. Her şeyin C, C++ veya Fortran dillerinde yazılması sağlanıyor ve kullanıcı alanı yürütülmesine odaklanılıyor. Makaleye göre, SPEC'in hedefi, yürütme süresinin en az %95'inin benchmark'ın kullanıcı alanı kodunda gerçekleşmesini sağlamak ve böylece işletim sisteminin etkisini en aza indirmektir.
SPEC, yeni paket için aday toplamak üzere yaklaşık üç yıldan biraz fazla bir süre (Şubat 2020 - Mart 2023) harcadı. 70 aday uygulama belirledi ve bunlardan 38'i SPEC'in CPU komitesinden geçti. Seçimlerde determinizm yine önemli bir rol oynadı, zira komite, “küçük mimari veya derleyici farklılıklarının çözüme ‘kısa yollar’ açabileceği” durumları önlemeye çalıştı. Teknik makalede, değerlendirmede derinlere inen ancak nihayetinde dahil edilmeyen birkaç spesifik uygulama olduğu da açıklanıyor.
Bunlar arasında modern yapay zeka iş yükleri olan llama.cpp ve whisper.cpp gibi uygulamalar öne çıkıyor. Teknik makalede, “bunları taşınabilir C++ kod yollarına (intrinsics'ler kaldırılmış olarak) kısıtlamak, gerçek dünya davranışlarından temel bir sapmaya neden oldu” ifadesi yer alıyor ve bu da onları diskalifiye ediyor. SPEC ayrıca, SPEC komite üyelerinin (Intel, AMD, IBM, Arm, Nvidia, Dell, HPE, Ampere ve diğerlerinden temsilciler) olası önyargı iddialarından kaçınmak için AV1 ve Opus codec'lerinden de kaçındı.
SPEC CPU 2026 Benchmark Listesi
SPEC CPU'nun nasıl çalıştığına dair üst düzey bir genel bakış aşağıdadır. Tam test paketi dört metrik inceler: tamsayı hızı, tamsayı verimliliği, kayan nokta hızı ve kayan nokta verimliliği. İki hız metriği birleşerek SPECspeed'i, iki verimlilik metriği ise SPECrate'i verir. SPECspeed, muhtemelen okuyucular için daha tanıdıktır. Bu, tek bir sistemde çalışan tek bir uygulamanın, o uygulamaya tüm mevcut kaynakları tahsis ederek performansını ölçer. SPECrate ise daha çok sunuculara odaklanarak, aynı uygulamanın birden çok kopyasının eşzamanlı çalıştığı toplam verimliliği ölçer.
Her paketin kendi benchmark listesi vardır, ancak bazı uygulamalar farklı paketlerde yeniden kullanılır. Örneğin, GCC ve LLVM derleme testleri hem SPECrate hem de SPECspeed Tamsayı paketlerinde bulunur. Benchmark'ların nereye yerleştirileceğini seçerken, SPEC, kayan nokta komutlarının %10'undan fazlasını içeren uygulamaları FP kategorisine ayırır. Bazı uygulamalar %1 ile %10 arasında kayan nokta komutlarına sahip olarak kendi tanımladıkları “gri bölgeye” düştü ve SPEC, uygulamaların “temel hesaplama amacına ve kullanıcı topluluğu içindeki yerleşik itibarına” dayanarak bu uygulamaları duruma göre kategorize etti.
İlk SPEC CPU 2026 Sonuçları
SPEC, AMD, Intel, Dell, Lenovo, Supermicro, HPE gibi çeşitli markalardan katkıda bulunanlar dahil olmak üzere SPEC CPU 2026 için düzinelerce başlangıç sonucu yayınladı. Anlaşılır bir şekilde, sonuçların çoğu sunuculara aittir ve burada hepsini kapsayamayız. Ancak, ilgileniyorsanız sonuçların tamamını doğrudan SPEC'ten inceleyebilirsiniz ve biz de birkaç ilginç sistemi öne çıkaracağız.
Sonuçlara geçmeden önce, SPEC her sistemi derecelendirmek için kendi puanını kullanır; her paket için temel veya zirve (veya her ikisi) sayıları bulunur. Nihai puan, SPEC'in bir iş yükünü bir referans sistemde tamamlama süresini test edilen sistemde tamamlama süresine bölerek hesapladığı her test için oranların geometrik ortalamasıdır.
Kayan nokta verimliliği sonuçlarından bir seçkiyle başlayalım. Sunucu kalabalığı arasında Raspberry Pi, Nvidia DGX Spark ve hatta Minisforum'dan mini bir bilgisayar gibi bir dizi tüketici cihazı da bulunuyor. Burada en yüksek performansı gösteren, dört adet Intel Xeon 6788P CPU barındıran ve sisteme toplam 688 iş parçacığı sağlayan HPE'nin ProLiant Compute DL580 Gen12'si oldu.
Kayan nokta paketi için hız sonuçlarına geçtiğimizde, tüketici sistemlerinin burada kaybolduğunu görüyoruz. En düşük sonuç Ampere eMAG 8180'den gelirken, en yüksek sonuç iki adet 96 çekirdekli AMD EPYC 9755 çipi barındıran Dell'in PowerEdge M7725'inden geldi. Hız sonuçları, tek bir uygulamayı çalıştıran tek bir sistemi inceler, bu nedenle “kopya” sütununu “iş parçacığı” ile değiştirdik.
Tamsayı sonuçlarına geçtiğimizde, tüketici sistemlerinin geniş bir yelpazesinin yanı sıra, donanımına göre şaşırtıcı derecede iyi performans gösteren M5 Pro işlemcili bir MacBook Pro 16 da görülüyor. Listenin başında, sisteme toplam 768 iş parçacığı sağlayan çift AMD EPYC 9755 işlemcili Dell'in PowerEdge M7725'i yer alıyor. Çoğu sonucun açık kaynaklı bir derleyici yerine satıcıya özgü bir derleyici kullandığını belirtmek gerekir, bu nedenle benzer donanımlarla farklı sonuçlar görebilirsiniz. SPEC CPU 2026 kaynak kodu olarak sunulur ve sonuçları rapor ederken derleyicinizi açıklamanız gerekir.
Son olarak, tek bir sistemin hızını ölçen tamsayı sonuçlarından bir örnek burada. Verimlilik burada odak noktası değil, bu nedenle daha fazla çip (ve dolayısıyla daha fazla iş parçacığı) barındıran bazı sistemlerin, örneğin HPE'nin ProLiant Compute DL580'i gibi, performansının düştüğünü görüyorsunuz. Listenin zirvesinde, çift AMD EPYC 9755 CPU ile toplam 512 iş parçacığına sahip Supermicro'nun Hyper A+ Server AS -2126HS-TN modeli yer alıyor.
SPEC CPU 2026'nın piyasaya sürülmesinin ardından, şirketlerin daha fazla sonuç yayınlayabilmesi için bir bekleme süresi olacak. 4 Haziran 2026'da daha fazla sonuç göreceğiz. 11 Ağustos'ta SPEC, SPEC CPU 2017 sonuçlarının da 2026 sonuçlarıyla birlikte sunulmasını gerektirecek ve 3 Kasım'da SPEC, CPU 2017'yi tamamen kullanımdan kaldıracak.
3 Kasım'a kadar, SPEC CPU 2017 lisansına sahip kullanıcılar yeni pakete 2.000 dolara yükseltebilirler. Yeni bir lisans 3.000 dolardır. Kâr amacı gütmeyen kuruluşlar paketi 750 dolara indirimli olarak alabilirken, belirli akademik kurumlar lisansı ücretsiz olarak temin edebilir.