Atlantik kasırga sezonu sona yaklaşırken, fırtınalı tropiklerin kış uykusuna çekilmesiyle birlikte meteorologların odağı, geride kalan sezonda nelerin işe yarayıp nelerin yaramadığını değerlendirmeye döndü.
Bu yıl, sonuçlar oldukça net. Google DeepMind'ın Hava Durumu Laboratuvarı, haziran ayında siklon (kasırga) takip tahminlerini yayınlamaya başlamış olmasına rağmen, şirketin yapay zeka tabanlı tahmin servisi olağanüstü bir performans gösterdi. Buna karşılık, ABD Ulusal Hava Servisi tarafından işletilen ve geleneksel fiziksel modellere dayanan, güçlü süper bilgisayarlarda çalışan Küresel Tahmin Sistemi (GFS) modeli ise beklenenin altında kaldı.
Tahmin modellerinin performansını karşılaştıran resmi veriler Ulusal Kasırga Merkezi tarafından birkaç ay içinde yayımlanacak. Ancak Miami Üniversitesi'nden kıdemli araştırmacı Brian McNoldy, şimdiden öncü analizler yaptı.
Bu analizlerin sonuçları oldukça çarpıcı:
Grafiği anlamak için küçük bir açıklama faydalı olacaktır. Bu grafik, bu sezondaki Atlantik Havzası'nda etkili olan 13 adlandırılmış fırtınanın tümünün takip tahmin doğruluğunu özetliyor. Tahmin süresi boyunca, 0 ila 120 saate (beş gün) kadar olan zaman dilimlerinde ortalama konum hatası ölçülüyor. Bu grafikte, bir hattın ne kadar aşağıda olması, modelin o kadar iyi performans gösterdiği anlamına geliyor.
Yeni Bir Şampiyon Ortaya Çıktı
Kesik siyah çizgi, 2022'den 2024'e kadar olan sezonlardaki resmi tahminlerin ortalama hata oranını gösteriyor. Bu noktada dikkat çeken, ABD'nin önde gelen küresel modeli GFS'nin (burada AVNI olarak belirtilmiş) açık ara en kötü performans gösteren model olması. Öte yandan, grafiğin altında bordo renkle gösterilen Google DeepMind modeli (GDMI), neredeyse tüm tahmin saatlerinde en iyi performansı sergiliyor.
ABD GFS modeli ile Google'ın DeepMind modeli arasındaki hata farkı dikkat çekici. Beş gün içinde Google'ın tahmini 165 deniz mili hata payına sahipken, GFS modelinin hata payı 360 deniz miliydi; bu da iki kattan daha kötü bir sonuç. Bu tür bir hata, tahmincilerin bir modeli tamamen göz ardı edip diğerine yönelmesine neden olabilir.
Ancak dahası da var. Google'ın modeli o kadar başarılıydı ki, insan uzmanların geniş bir model verisini inceleyerek oluşturduğu Ulusal Kasırga Merkezi'nin (OFCL) resmi tahminlerini düzenli olarak geride bıraktı. Yapay zeka tabanlı model ayrıca, TVCN ve HCCA gibi saygın "konsensüs modellerini" de geride bıraktı.
Bu erken model karşılaştırması, Avrupa Orta Menzilli Hava Tahmin Merkezi tarafından üretilen "altın standart" geleneksel, fizik tabanlı modeli içermiyor. Ancak ECMWF modeli genellikle kasırga takip tahminlerinde, birçok farklı model çıktısını ağırlıklandıran kasırga merkezi veya konsensüs modellerinden daha iyi performans göstermez. Dolayısıyla, Google DeepMind'dan üstün olması pek olası görünmüyor.
Bu, Tahminleri Sonsuza Dek Değiştirecek
DeepMind'ın, kasırgaların güçündeki dalgalanmalar olan yoğunluk tahminlerinde de olağanüstü bir performans sergilediğini belirtmekte fayda var. Yani ilk sezonunda hem kasırga takibi hem de yoğunluğu konusunda büyük başarı elde etti.
Çeyrek asırdır geleneksel fizik tabanlı modellere güvenen bir tahminci olarak, bu sonuçların ne kadar şaşırtıcı olduğunu ifade etmek güç. İlerleyen dönemde, nispeten yeni olmaları ve gelişim potansiyeli barındırmaları nedeniyle önümüzdeki yıllarda da gelişmesi beklenen Google ve diğer yapay zeka hava durumu modellerine büyük ölçüde güveneceğimiz söylenebilir.
Bir kasırga uzmanı ve Eye on the Tropics bülteninin yazarı Michael Lowry, model performansı hakkında şunları belirtti: "DeepMind ve benzeri veri odaklı, yapay zeka tabanlı hava durumu modellerinin güzelliği, dünyanın en pahalı ve gelişmiş süper bilgisayarlarını gerektiren geleneksel fizik tabanlı rakiplerine kıyasla tahminleri ne kadar daha hızlı üretebilmeleridir. Bunun ötesinde, bu "akıllı" modeller, sinir ağları mimarileriyle hatalarından ders çıkarıp anında düzeltebilme yeteneğine sahip."
Peki Ya Kuzey Amerika Modeli?
GFS modeli gelince, bu sezon neden bu kadar kötü performans gösterdiğini açıklamak zor. Geçmişte, en kötü ihtimalle bir tahminde dikkate alınmaya değerdi. Ancak bu yıl, ben ve diğer tahminciler onu sık sık göz ardı ettik.
Lowry, "GFS'nin bu kasırga sezonunda neden bu kadar kötü performans gösterdiğinin hemen anlaşılmadığını" yazdı. "Bazıları, bu yıl yaşanan veri toplama kesintilerinin katkıda bulunmuş olabileceğini speküle etti, ancak böyle bir faktörün sadece Amerikan GFS'sini değil, diğer küresel fizik tabanlı modelleri de etkilemiş olması gerekirdi."
ABD hükümetinin kapalı olması nedeniyle, yakın zamanda pek fazla yanıt bekleyemeyiz. Ancak, modelin dinamik çekirdeğinde 2019'da başlayan büyük yükseltmenin büyük ölçüde başarısız olduğu anlaşılıyor. Eğer GFS bir on yıl önce rakiplerinin biraz gerisindeyse, şimdi daha da hızlı bir şekilde geride kalıyor.