Yeni bir kuantum bilgisayar test ölçütü (benchmark), farklı kuantum işlem birimlerinin (QPU) güçlü ve zayıf yönlerini ortaya koydu. Yapılan testlerde beş farklı tedarikçiye ait 19 farklı QPU karşılaştırıldı. Bu testlerin amacı, yüksek performanslı hesaplama (HPC) görevleri için hangi çiplerin daha kararlı ve güvenilir olduğunu belirlemekti.
Kuantum sistemler, hem farklı "genişliklerde" (toplam qubit sayısı) hem de 2-qubit kapıları için farklı "derinliklerde" test edildi. Kapılar, iki qubit üzerinde eş zamanlı olarak çalışan işlemlerdir. Derinlik ise bir devrenin uzunluğunu, yani karmaşıklığını ve çalışma süresini ölçer. Qubitler, kuantum bilgisayarların temel bilgi birimleridir.
Test sonuçlarına göre, IBM'in QPU'ları derinlik kategorisinde en büyük gücü gösterirken, Quantinuum daha fazla sayıda qubitin test edildiği genişlik kategorisinde en iyi performansı sergiledi. IBM'in QPU'ları ayrıca sürümler arasında, özellikle önceki nesil çipler ile daha yeni nesil çipler arasında performansta önemli iyileşmeler gösterdi. Bu performans artışlarının yalnızca daha iyi ve verimli donanıma değil, aynı zamanda ürün yazılımındaki iyileştirmelere ve kesirli kapıların (fractional gates) entegrasyonuna bağlı olabileceği belirtiliyor. Ancak, IBM'in en yeni Heron çipinin Marrakesh adlı versiyonu, önceki QPU'su Fez'e göre katmanlı kapı başına yarı yarıya daha az hataya sahip olmasına rağmen beklenen performans iyileştirmesini göstermedi.
Klasik Hesaplamanın Ötesine Geçmek
Küçük şirketler de önemli kazanımlar elde etti. Özellikle, Quantinuum'a ait bir çip, 56 qubit genişliğinde test ölçütünü geçti. Bu önemli bir başarı, çünkü kuantum hesaplama sistemlerinin belirli bağlamlarda mevcut klasik bilgisayarları aşma potansiyelini gösteriyor.
Araştırmacılar, Quantinuum H2-1 örneğinde, 50 ve 56 qubite kadar yapılan deneylerin, yüksek performanslı klasik sistemlerdeki tam simülasyon yeteneklerinin üzerinde olduğunu ve sonuçların hala anlamlı olduğunu belirtiyor.
Özel olarak, Quantinuum H2-1 çipi, 56 qubitle Linear Ramp Quantum Approximate Optimization Algorithm (LR-QAOA) adlı bir test algoritmasının üç katmanını çalıştırarak sonuç üretti. Bu test, 4.620 adet iki-qubit kapısı içeriyordu. Bilim insanları, bildikleri kadarıyla bunun, rastgele tahmine göre daha iyi sonuç verdiği doğrulanan, gerçek kuantum donanımında bir kombinasyon optimizasyon problemini çözmek için yapılmış en büyük QAOA uygulaması olduğunu söylüyor.
IBM'in Fez çipi ise test edilen sistemler arasında en yüksek derinlikteki problemleri yönetti. 100 qubite kadar bir problemi 10.000 katmana kadar LR-QAOA kullanarak test eden bir senaryoda (yaklaşık bir milyon iki-qubit kapısı), Fez yaklaşık 300. katmana kadar tutarlı bilgiyi koruyabildi. Testlerde en düşük performansı sergileyen QPU ise Rigetti'nin Ankaa-2 çipi oldu.
Araştırmacılar, bu test ölçütünü (benchmark) bir QPU'nun pratik uygulamaları gerçekleştirme potansiyelini ölçmek için geliştirdi. Bu amaçla, net ve tutarlı kurallara sahip, kolayca çalıştırılabilen, platformdan bağımsız (geniş yelpazedeki kuantum sistemlerinde çalışabilen) ve performansla ilişkili anlamlı metrikler sağlayan bir test tasarlamaya çalıştılar.
Test ölçütleri, MaxCut problemi adı verilen bir test üzerine kuruldu. Bu problem, birkaç tepe noktası ve kenarı olan bir grafik sunar ve sistemden, kenar sayısı en fazla olacak şekilde düğümleri iki küme halinde bölmesini ister. Bilim insanları, bu problemin hesaplama açısından çok zor olması ve zorluğunun grafiğin boyutunu artırarak ölçeklendirilebilmesi nedeniyle iyi bir test ölçütü olduğunu belirtiyor. Bir sistem, sonuçlar tamamen karışık bir duruma ulaştığında, yani rastgele örnekleyiciden elde edilenlerden ayırt edilemez hale geldiğinde testi geçememiş sayıldı.
Bilgisayar bilimcileri, test ölçütünün nispeten basit ve ölçeklenebilir bir test protokolüne dayanması ve küçük bir örneklem kümesiyle anlamlı sonuçlar üretebilmesi nedeniyle çalıştırılmasının nispeten ucuz olduğunu ekledi.
Yeni test ölçütü kusursuz değil. Örneğin, performans sabit program parametrelerine bağlı, yani parametreler hesaplama sırasında dinamik olarak ayarlanmıyor ve optimize edilemiyor. Bilim insanları, kendi testlerinin yanı sıra, "performansın temel yönlerini yakalamak için farklı aday test ölçütlerinin önerilmesi gerektiğini ve en açık kurallara ve faydaya sahip olanların kalıcı olacağını" öne sürüyor.